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本 书 由 五 种 讨论 社会 科学 研究 中 的 数理 基础 知识 的 小 册子 组 成 ， 分 别 是 《社会 统计 
的 数学 基础 》、《 微 分 方程 : 一 种 建 模 方法 》 《基于 布尔 代数 的 比较 法 导论 人 《模糊 集 
合理 论 在 社会 科学 中 的 应 用 》 以 及 《评估 不 平等 》。 本 书 首先 介绍 了 定量 方法 中 常用 的 
数理 知识 ， 然 后 具体 介绍 了 以 微分 方程 来 构建 模型 的 方法 、 比 较 法 的 基础 知识 以 及 模糊 
集合 理论 在 社会 科学 中 的 应 用 ， 最 后 针对 社会 科学 中 的 中 心 话题 一 一 不 平等 问题 ， 介 绍 
了 测量 和 分 析 不 平等 的 各 种 方法 。 
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1976 年 ， 当 政府 管理 与 政治 学 教授 Eric Uslaner 向 SAGE 出 版 社 的 创始 人 
Sara 建议 出 版 关于 重要 定量 研究 方法 的 简明 小 册子 时 ， 没 有 人 预见 到 这 套 书 会 
取得 巨大 成 功 。 

那 年 夏天 ," 社 会 科学 定量 研究 方法 ”丛书 诞生 。 统 一 的 、 朴 素 的 绿色 封面 ， 
上 面 仅 仅 印 着 书 名 、 作 者 名 及 本 书 所 属 的 系列 名 。lverson 和 Northporth 的 《 变 
量 分 析 》( Analysis of Variance )、Nagel 的 《运筹 学 》( Operations Research ) 
以 及 Henkel 的 《显著 性 检验 》( Tests of Significance) 是 最 早出 版 的 几 本 ， 每 
本 售 价 2.95 英镑 ， 被 形容 为 “ 像 烤 饼 一 样 好 卖 ”。 

SAGE 选择 了 20 种 顶尖 的 定量 研究 工具 ， 然 后 去 寻找 合适 的 作者 ， 邀 请 
他 们 围绕 这 些 工具 撰写 92 页 的 小 书 。 这 些 薄 薄 的 绿 皮 书 在 课堂 上 深 受 欢迎 ， 
在 图 书馆 成 套 陈列 。 

至 今 ， 绿 皮 书 系列 中 共有 160 种 在 初版 或 再 版 。 书 的 主题 反映 了 量化 研究 
方法 的 发 展 : 从 基础 统计 知识 、 数 据 类 型 、 测 量 到 计算 机 的 应 用 以 及 博弈 论 。 
这 套 书 非常 畅销 ， 其 中 最 畅销 的 一 本 ， 是 1980 年 出 版 的 Michael Lewis-Beck 
的 《回归 方法 的 应 用 》( Applied Regression )。 
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本 书 由 五 种 讨论 社会 科学 研究 中 的 数理 基础 知识 的 小 册子 组 成 ,分 别 是 
《社会 统计 的 数学 基础 》《 微 分 方程 :一 种 建 模 方法 》《 基 于 布尔 代数 的 比较 法 
导论 》《 模 糊 集合 理论 在 社会 科学 中 的 应 用 》 以 及 《评估 不 平等 》。 任 何 用 定量 
方法 对 社会 科学 中 的 某 些 问题 进行 研究 的 人 都 需要 对 数理 知识 和 方法 有 一 
的 了 解 。 本 书 首先 介绍 了 te tt 
微分 方程 来 构建 模型 .比较 法 科学 中 的 某 些 问题 进 集合 理论 在 社会 科学 中 的 应 
用 ,最 后 针对 社会 科学 中 的 中 研究 的 人 都 需要 对 问题 ,介绍 了 对 不 平等 的 各 种 
测量 方法 。 

《社会 统计 的 数学 基础 汶 那 些 希 望 进行 统计 学 和 统计 学 中 的 基础 知识 , 比 
如 和 矩阵、 线性 代数 、 积 分 ,处理 模糊 性 的 适当 方法 《微分 方程 :一 种 建 模 方法 ;着 

重 介绍 微分 方程 ,提出 改变 以 变量 为 取向 的 思维 定 势 , 强 调 对 过 程 的 理解 。《 基 
于 布尔 代数 的 比较 法 导论 》 对 比较 法 进行 了 深入 论述 并 提供 了 技术 指导 ,如 布 
尔 代数 “小 样本 ”方法 “模糊 集合 ”方法 等 。. 《模糊 集 合理 论 在 社会 科学 中 的 应 
用 ;提供 了 一 种 处 理 模 糊 性 的 适当 方法 ,为 那些 希望 进行 统计 推论 的 研究 者 提 
供 指引 。《 评 估 不 平等 ?提供 了 不 平等 测量 的 原理 和 标准 ,并 将 其 与 分 位 数 回 归 
方法 相 联系 ,探讨 对 整体 分 布 进行 比较 的 方法 。 
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往事 如 烟 ,光阴 如 梭 。 转 眼 间 ,出 国 已 然 十 年 有 余 。1996 年 赴 美 留学 ,最 初 
选择 的 主攻 方向 是 比较 历史 社会 学 ,研究 的 兴趣 是 中 国 的 制度 变迁 问题 。 以 我 
以 前 在 国内 所 受 的 学 术 训 练 ,基本 是 看 不 上 定量 研究 的 。 一 方面 ,我 们 倾向 于 
研究 大 问题 ,不 喜欢 纠缠 于 细 枝 术 节 。 国 内 一 位 老师 的 话 给 我 的 印象 很 深 ,大 
致 是 说 :如 果 你 看 到 一 堵 墙 就 要 倒 了 ,还 用 得 着 纠缠 于 那 墙 墙 的 倾斜 角度 究竟 
是 几 度 吗 ? 所 以 ,很 多 研究 都 是 大 而 化 之 ,只 要 说 得 通 即 可 。 另 一 方面 ,国内 
(十 年 前 ) 的 统计 教学 ,总 的 来 说 与 社会 研究 中 的 实际 问题 是 相 脱 节 的 。 结 果 
是 ,很 多 原先 对 定量 研究 感 兴趣 的 学 生 在 学 完 统计 之 后 ,依旧 无 从 下 手 ,逐渐 失 
去 了 对 定量 研究 的 兴趣 。 

我 所 就 读 的 美国 加 州 大 学 洛杉矶 分 校 社会 学 系 ,在 定量 研究 方面 有 着 系统 
的 博士 训练 课程 。 不 论 研究 兴趣 是 定量 还 是 定性 的 ,所 有 的 研究 生 第 一 年 的 头 
两 个 学 期 必须 修 两 门 中 级 统计 课 , 最 后 一 个 学 期 的 系列 课程 则 是 简单 介绍 线性 
回归 以 外 的 其 他 统计 方法 ,是 选修 课 。 希 望 进一步 学 习 定量 研究 方法 的 可 以 在 
第 二 年 修 读 男 外 一 个 三 学 期 的 系列 课程 ,其 中 头 两 门 课 叫 “调查 数据 分 析 ”, 第 
三 门 叫 “研究 设计 ”。 除 此 以 外 ,还 有 如 “ 定 类 数据 分 析 ”“ 人 口 学 方法 与 技术 ”、 
“事件 史 分 析 ”“ 多 层 线 性 模型 "等 专门 课程 供 学 生 选 修 。 该 学 校 的 统计 系 、 心 
理 系 .教育 系 、 经 济 系 也 有 一 批 范 声 国 际 的 学 者 ,提供 不 同 的 .更 加 专业 化 的 课 
程 供 学 生 选 修 。2001 年 完成 博士 学 业 之 后 ,我 又 受 安德鲁 ， 梅 隆基 金 会 资助 ， 
在 世界 定量 社会 科学 研究 的 重镇 密 吹 根 大 学 从 事 两 年 的 博士 后 研究 ,其 间 旁 听 
谢 宇 教授 为 博士 生 讲 授 的 统计 课程 ,并 参与 该 校 社会 研究 院 (Institute for Social 
Research) 定 量 社会 研究 方法 项 目的 一 些 讨论 会 ,受益 良 多 。 
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| 社会 科学 中 的 数理 基础 及 应 用 


2003 年 ,我 赴 港 工作 ,在 香港 科技 大 学 社会 科学 部 ,教授 研究 生 的 两 门 核心 
定量 方法 课程 。 香 港 科技 大 学 社会 科学 部 自 创建 以 来 ,非常 重视 社会 科学 研究 
方法 论 的 训练 。 我 开设 的 第 一 门 课 “ 社 会 科学 里 的 统计 学 ”Statistics for Social 
Science) 为 所 有 研究 型 硕士 生 和 博士 生 的 必修 课 , 而 第 二 门 课 “社会 科学 中 的 定 
量 分 析 ” 为 博士 生 的 必修 课 ( 事 实 上 ,大 部 分 硕士 生 在 修 完 第 一 门 课 后 都 会 继续 
选修 第 二 门 课 ) 。 我 在 讲授 这 两 门 课 的 时 候 ,根据 社会 科学 研究 生 的 数理 基础 
比较 薄弱 的 特点 ,尽量 避免 复杂 的 数学 公式 推导 ,而 用 具体 的 例子 ,结合 语言 和 
图 形 ,帮助 学 生理 解 统计 的 基本 概念 和 模型 。 课 程 的 重点 放 在 如 何 应 用 定量 分 
析 模 型 研究 社会 实际 问题 上 , 即 社会 研究 者 主要 为 定量 统计 方法 的 “消费 者 ”而 
非 “ 生 产 者 ”。 作 为 “消费 者 ”, 学 完 这 些 课程 后 ,我 们 一 方面 能 够 读 懂 、 欣 赏 和 评 
价 别人 在 同行 评议 的 刊物 上 发 表 的 定量 研究 的 文章 ; 男 一 方面 ,也 能 在 自己 的 
研究 中 运用 这 些 成 熟 的 方法 论 技术 。 

上 述 两 门 课 的 内 容 , 尽 管 在 线性 回归 模型 的 内 容 上 有 少量 重复 ,但 各 有 侧 
重 。“ 社 会 科学 里 的 统计 学 ”(Statistics for Social Science) 从 介绍 最 基本 的 社会 
研究 方法 论 和 统计 学 原理 开始 ,到 多 元 线性 回归 模型 结束 ,内 容 涵 盖 了 描述 
性 统计 的 基本 方法 、 统 计 推 论 的 原理 \ 假 设 检验 、 列 联 表 分 析 、 方 差 和 协 方差 
分 析 、 简 单线 性 回归 模型 .多 元 线性 回归 模型 ,以 及 线性 回归 模型 的 假设 和 模 
型 诊断 。“ 社 会 科学 中 的 定量 分 析 ” 则 介绍 在 经 典 线性 回归 模型 的 假设 不 成 
立 的 情况 下 的 一 些 模型 和 方法 ,将 重点 放 在 因 变 量 为 定 类 数据 的 分 析 模 型 
上 ,包括 两 分 类 的 logistic 回归 模型 ,多 分 类 logistic 回归 模型 . 定 序 logistic 回 
归 模 型 .条件 logistic 回归 模型 .多 维 列 联 表 的 对 数 线性 和 对 数 乘积 模型 有关 
删节 数据 的 模型 、 纵 贯 数据 的 分 析 模 型 ,包括 追踪 研究 和 事件 史 的 分 析 方 法 。 
这 些 模型 在 社会 科学 研究 中 有 着 更 加 广泛 的 应 用 。 

修 读 过 这 些 课 程 的 香港 科技 大 学 的 研究 生 , 一 直 鼓 励 和 支持 我 将 两 门 课 的 
讲稿 结集 出 版 ,并 帮助 我 将 原来 的 英文 课程 讲稿 译 成 了 中 文 。 但 是 ,由 于 种 种 
原因 ,这 两 本 书 拖 了 四 年 多 还 没有 完成 。 世 界 著 名 的 出 版 社 SAGE 的 “定量 社 
会 科学 研究 ”丛书 闻名 遐 途 ,每 本 书 都 写 得 通俗 易 懂 。 中 山大 学 马 骏 教 授 向 格 
致 出 版 社 何 元 龙 社 长 推荐 了 这 套 书 , 当 格致 出 版 社 向 我 提出 从 这 套 丛书 中 精 选 
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一 批 翻译 ,以 给 中文 读者 时 ,我 非常 支持 这 个 想法 ,因为 这 从 某 种 程度 上 弥补 了 
我 的 教科 书 未 能 出 版 的 遗憾。 

翻译 是 一 件 吃力 不 讨好 的 事 。 不 但 要 有 对 中 英文 两 种 语言 的 精准 把 握 能 
力 , 还 要 有 对 实质 内 容 有 较 深 的 理解 能 力 ,而 这 套 丛 书 涵盖 的 又 恰恰 是 社会 科 
学 中 技术 性 非常 强 的 内 容 , 只 有 语言 能 力 是 远 远 不 能 胜任 的 。 在 短 短 的 一 年 时 
间 里 ,我 们 组 织 了 来 自 中 国内 地 及 港 台地 区 的 二 十 几 位 研究 生 参 与 了 这 项 工 
程 ,他 们 目前 大 部 分 是 香港 科技 大 学 的 硕士 和 博士 研究 生 , 受 过 严格 的 社会 科 
学 统计 方法 的 训练 ,也 有 来 自 美国 等 地 对 定量 研究 感 兴趣 的 博士 研究 生 。 他 
们 是 : 

香港 科技 大 学 社会 科学 部 博士 研究 生 蒋 勤 、 李 骏 、 盛 智明 、 叶 华 、 张 卓 妮 、 
郑 冰岛 ,硕士 研究 生 贺 光 烨 、 李 兰 、 林 毓 玲 、 肖 东 亮 . 辛 济 云 . 於 嘉 、 余 丙 丙 ,应 
用 社会 经 济 研究 中 心 研 究 员 李 俊秀 ;香港 大 学 教育 学 院 博士 研究 生 潜 岩 壁 ; 
北京 大 学 社会 学 系 博士 研究 生 李 丁 、 赵 亮 员 ;中 国人 民 大 学 人 口 学 系 讲师 下 
锡 炜 ;中 国 台湾 “中 央 ” 研 究 院 社会 学 所 助理 研究 员 林 宗 弘 ;南京 师范 大 学 心 
理学 系 副 教授 陈 陈 ;美国 北 卡罗来纳 大 学 教 得 山 分 校 社会 学 系 博 士 候选 人 姜 
念 涛 ;美国 加 州 大 学 洛杉矶 分 校 社会 学 系 博士 研究 生 宋 曦 。 

关于 每 一 位 译 者 的 学 术 背 景 , 书 中 相关 部 分 都 有 简单 的 介绍 。 尽 管 每 本 
书 因 本 身 内 容 和 译 者 的 行文 风格 有 所 差异 ,校对 也 未 免 挂 一 漏 万 ,术语 的 标 
准 译 法 方面 还 有 很 大 的 改进 空间 ,但 所 有 的 参与 者 都 做 了 最 大 的 努力 ,在 繁 
忙 的 学 习 和 研究 之 余 ,在 不 到 一 年 的 时 间 内 ,完成 了 三 十 五 本 书 、 超 过 百 万 字 
的 翻译 任务 。 李 骏 、 叶 华 、 张 卓 妮 、 贺 光 烨 、 宋 曦 、 於 嘉 、 郑 冰岛 和 林 宗 弘 除 了 
承担 自己 的 翻译 任务 之 外 ,还 在 初稿 校对 方面 付出 了 大 量 的 劳动 。 香 港 科技 
大 学 霍英东 南沙 研究 院 的 工作 人 员 曾 东 林 ,协助 我 通读 了 全 稿 ,在 此 我 也 致 
以 诚挚 的 谢意 。 有 些 作者 ,如 香港 科技 大 学 黄 善 国教 授 、 美 国 约翰 BES 
斯 大 学 郝 令 昕 教授 ,也 参与 了 审 校 工作 。 

由 于 所 选 每 本 书 都 有 一 篇 序言 ,对 相关 方法 的 背景 和 应 用 作 了 很 好 的 介 
绍 ,我 们 均 耶 以 保留 ,内容 在 此 不 再 袭 述 。 为 了 方便 起 见 , 我 们 将 内 容 相似 的 书 
目 集 册 出 版 ,每 册 三 至 五 本 不 等 , 共 八 册 , 它 们 分 别 是 :《 线 性 回归 分 析 基 础 》、 
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《高 级 回归 分 析 》《 广 义 线性 模型 》《 列 表 数 据 分 析 》《 纵 贯 数据 分 析 》《 因 果 关 
系 模型 》《 社 会 科学 中 的 数理 基础 及 应 用 》 和 《数据 分 析 方 法 五 种 》。 所 冠 书 名 
未 必 能 精准 涵盖 其 中 的 内 容 , 读 者 可 自行 参阅 每 本 书 的 序言 或 目录 。 

我 们 希望 本 丛书 的 出 版 ,能 为 推动 国内 社会 科学 定量 研究 的 扎实 学 风 作 出 
一 点 贡献 。 


K EN] 
于 香港 九龙 清水 湾 
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学 社会 学 系 、 数 学 系 及 统计 学 系 的 教授 。 其 现 阶段 的 工作 包括 统计 方法 研究 (例如 ,三 维 
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( The Journal of Computational and Graphical Sialistics)《 美 国 统计 协会 会 刊 》( The Jour- 
nal of the American Statistical Association) 《加 拿 大 社会 学 与 人 类 学 评论 》{ The Canadian 
Review of Sociology and Anthropology ) 以 及 《加 拿 大 社会 学 期 刊 》{ The Canadian Journal of 
Sociology) $. BRSEUSZARE, 其 中 包括 《应 用 a 归 分 析 和 广义 线性 模型 》 第 二 版 ) 
~ {Applied Regression Anal ysis and Generalized Linear Models , Second Edi tion, Sage, 
2008)《 非 参数 简单 回归 》( Nonparametric Simple Regression , Sage, 2000) 和 《多 元 及 广 
义 参数 回归 》( Multiple and Generalized Nonparametric Regression, Sage, 2000). 


译 者 简介 


2007 年 获 南京 大 学 理学 学 士 学 位 ,目前 是 香港 科技 大 学 社会 科学 部 硕士 研究 生 。 


曾经 有 一 位 社会 学 的 博士 研究 生 跟 我 说 ,他 要 去 统计 学 系 上 一 门 基础 课程 ,我 问 他 : 
“为 什么 ”他 回答 : 每 次 在 我 想 更 深入 地 学 习 高 级 定量 方法 时 ,总 感觉 有 一 堵 无 形 的 
墙 。 统 计 学 系 开 的 课程 相对 于 社会 科学 系 来 说 ,其 数学 基础 更 强 , 因此 相对 于 社会 学 系 
的 学 生 , 统计 学 系 的 学 生 就 更 容易 翻越 这 堵 墙 。 然 而 ,近期 的 许多 话题 ,诸如 稳健 回归 、 
潜在 增长 曲线 模型 等 , 均 需 要 用 到 较 多 更 深层 次 的 数学 知识 , 从 而 使 许多 读者 望 而 生 睫 。 

《社会 统计 的 数学 基础 》 就 是 为 这 些 想 进一步 学 习 定量 方法 却 时 常 感到 被 那 堵 无 形 
的 墙 所 阻碍 的 学 者 而 编写 的 。 这 本 小 册子 涵盖 了 许多 数学 和 统计 学 中 容易 被 人 忽视 却 
又 至 关 重要 的 话题 (如 矩阵 线性 代数 、 积 分 、 概 率 理 论 及 统计 分 布 ) ,这 些 话 题 经 常 在 统 
计 书 籍 和 论文 中 出 现 , 许 多 读者 或 许 以 前 还 接触 过 ,但 是 对 于 大 多 数 从 事 社 会 科学 研究 
的 读者 而 言 , 可 能 还 比较 陌生 。 

当 得 知 福克斯 的 这 个 项 目 时 ,我 异常 兴奋 并 积极 鼓励 他 完成 这 本 书 。 事 实 上 ,许多 
评论 家 包括 作者 本 人 都 感叹 ,如 果 类 似 这 样 的 书 可 以 早出 版 几 年 ,比如 ,在 他 们 学 习 统 计 
的 时 候 , 或 者 在 他 们 为 定量 方法 课程 准备 授课 讲义 的 时 候 , 那 该 有 多 好 。 

对 于 这 本 书 , 评 论 家 一 致 认为 ; 它 会 是 协助 研究 生 及 社会 统计 工作 者 进行 研究 的 得 
力 助 手 , 也 会 成 为 大 受 欢迎 的 书籍 。 同 时 , 这 本 书 更 将 是 对 定量 方法 研究 的 一 个 重要 
补充 。 


B (Tim Futing Liao) 


第 1 | 矩阵 线性 代数 和 几何 向 量 


和 矩阵 为 大 多 数 统计 提供 了 一 种 自然 诠释 ;线性 代数 是 有 关 线 性 统计 模型 的 
代数 计算 ;几何 向 量 是 一 种 非常 强大 的 概念 性 工具 , 它 在 理解 线性 代数 和 标识 
线性 模型 等 方面 很 有 用 。 本 章 的 目的 是 介绍 有 关 和 矩阵 、 线 性 代数 和 几何 向 量 的 
基本 概念 。 这 些 相关 话题 在 社会 统计 中 应 用 广泛 , 且 其 编排 形式 相对 于 严格 的 
数学 表述 来 讲 是 非 正式 的 。 一 方面 ,许多 计算 结果 没有 提供 详尽 的 根据 ,而 另 
一 方面 ,这 些 根 据 均 是 提纲 者 领 的 。 对 更 深入 的 线性 代数 感 兴趣 的 读者 可 以 参 
看 相关 主题 的 教科 书 , 以 获得 详细 的 解释 (推荐 阅读 请 参见 本 章 末 尾 ) 。 


KERE 


基本 定义 


和 矩阵 是 一 组 数字 或 数字 变量 的 长 方形 阵列 ,例如 ， 


1 =2 3 
4 -= =b 
X= [1.1] 
《4X3) T 8 9 
0 0 10 
其 更 一 般 地 表示 为 : 
ai Ul2 Ul 
C21 U22 ”QQ2 
a y [1. 2] 
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IRXPERY m FFn JEPET AFRA m 乘 MERET Con Xn). HIEN R 
有 时 候 在 矩阵 的 下 方 表示 阶 , 如 方程 1. 1 和 方程 1. 2 所 表示 。 和 矩阵 的 每 一 个 元 
或 者 元 素 可 以 用 它 的 行列 下 标 表示 ,如 a, AME A 的 第 i GB NTR. K 
矩阵 为 单一 ( 实 ) 数 , 则 被 称 为 " 纯 量 "。 有 时 为 了 简洁 方便 ,我 把 矩阵 中 的 典型 元 
素 放 在 一 个 括号 里 来 表示 矩阵 ,如 A = las) 等 价 于 方程 1. 2。 

一 个 只 有 一 列 元 素 的 矩阵 为 列 向 量 , 如 


与 之 类 似 , 一 个 只 有 一 行 元 素 的 矩阵 为 行 向 量 ， 
b = [bs bos ati b, | 
为 了 便于 区 分 ,我 在 行 向 量 的 元 素 间 加 上 了 逗号 。 
JERE A 的 转 置 表示 为 A', 它 是 将 A 的 第 i 行 转变 为 A' 的 第 i 列 所 构成 ,所 
以 (用 方程 1. 1 和 方程 1.2) A: 


rod 4 7 09 
“一 | 一 2 一 5 8 0 

(3X4) 

Lo —6 9 10 

[an U21 am | 
Al aiz A22 a 
(km) . 

LQ An Am 








请 注意 , (AD! = A, 通常 ,我 所 说 的 向 量 是 指 列 向 量 (如 上 面 的 a) ,除非 明确 指 
出 它 是 被 转 置 的 (如 b. 

N 阶 矩 阵 ,正如 它 的 名 字 一 样 ,拥有 行 n 列 。 元 素 ai PWM ais az, =, 
Am ) 组 成 了 方 阵 A 的 主 对 角 线 。 对 角 线 上 所 有 元 素 的 和 叫做 矩阵 的 “ 迹 ”; 
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trace(A) = 2 Qi 
如 , 方 阵 : 








其 对 角 线 元 素 为 一 5、2 和 一 4, 因此 迹 为 Mo, = 
如 果 A= A’, 则 称 该 方 阵 是 对 称 的 , 即 对 于 所 有 的 i 和 j, a = a o 根据 定 
义 可 知 ,( 上 面 的 ) 方 阵 B 是 不 对 称 的 ,而 方 阵 


= | 3 
1 2 l 
3.6 —4 


是 对 称 的 。 统 计 应 用 中 的 许多 和 矩阵 都 是 对 称 的 ,如 相关 性 矩阵、 协 方差 矩阵 、 平 
方 和 和 矩阵 或 者 交叉 乘积 矩阵 。 
上 三 角 和 矩阵 是 指 主 对 角 线 下 方 的 元 素 都 为 0 的 矩阵 : 


C= 





0 U22 °°° Un 


ly, 0 0 

la Loo 0 
L = | 

l 1 lz l 


对 角 和 矩阵 是 指 除 主 对 角 线 外 ,其 他 元 素 都 为 0 的 矩阵 : 
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di 0 0 
0 dz 0 
D = 
(nXn) ° 
0 0 d 


为 简单 起 见 , 我 将 对 角 和 矩阵 D 表示 为 D = diag(d,, dz, +++, dp). AUER MEE AT 
有 元 素 都 相等 的 对 角 和 拖 阵 : S = diag(s1，ss，*…，5,)。 一 种 重要 的 纯 量 和 矩阵 是 单 
位 矩阵 , 它 的 主 对 角 线 上 的 元 素 全 是 1: 


1 6 0 
0 ql 0 
I = 
(nXn) 
0 0 eee 1 


我 一 般 将 , 工 写成 工 。 

另外 两 种 重要 的 纯 量 矩 阵 是 零 矩 阵 ( 所 以 元 素 都 为 0) 和 向 量 1( 所 有 元 素 都 
为 1) 。 我 用 1, 表示 元 向 量 , 如 了 = [1, 1,，1,，1]】。 尽 管 单位 矩阵 、 零 矩阵 和 
向 量 1 都 属于 矩阵 ,但 是 为 方便 起 见 , 我 们 通常 指定 它们 为 奇异 矩阵 ,如 单位 和 矩 
阵 就 是 一 个 奇异 矩阵 。 

分 块 矩 阵 是 指 将 一 个 矩阵 的 元 素 分 归于 若干 子 和 矩阵, 如 


An Ay 
‘= (3X2) (3X1) 
Ao) An 
(1x2) axl) 





其 中 , 子 矩阵 Au 为 : 


a31 432 


FARE Ar, An, Ax 具有 类 似 的 定义 。 当 没有 歧义 时 ,我 会 将 子 和 矩阵 间 的 线 省 
略 。 如 果 一 个 矩阵 仅 被 垂直 分 割 ,我 会 用 逗号 来 区 分 子 和 矩阵 ,例如 ， 


8 


| 社会 科学 中 的 数理 基础 及 应 用 


C — | Cı 9 C; ] 
(mXn +p) (mXn) (mXp) 


简单 矩阵 运算 法 则 


如 果 两 个 矩阵 具有 相同 的 阶 且 它们 相应 的 元 素 都 相等 ,那么 ,我 们 说 这 两 
个 矩阵 相等 。 

当 且 仅 当 两 个 矩阵 同 阶 时 ,它们 才 可 以 相 加 ,通过 将 两 个 和 矩阵 中 的 对 应 元 素 
相 加 , 即 可 得 到 抢 阵 的 和 。 因 此 , 当 A AB 均 为 (mXn) 阶 时 ,那么 , C== A 十 B， 
其 阶 仍 为 (nm Xn), H cj =a; 十 b;。 A. D = A 一 B, 那么 ,D 的 阶 也 为 
(mXn), Ady = ay 一 6;。 如 果 要 求 和 矩阵 A 的 负 和 矩阵 EE, 即 EE 二 一 A, 它 的 阶 同 
A 相等 , 则 e =— aj o 例如 : 


我 们 得 到 : 


由 于 这 些 计算 均 是 针对 元 素 的 运算 ,所 以 矩阵 相 加 、 相 减 及 求 其 负 抢 阵 的 
依据 都 与 纯 量 运算 法 则 相同 。 特 别 是 : 
A 十 B 三 B 十 A( 和 矩阵 相 加 的 交换 律 ) 
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A 十 (B 十 C) = (A+B) 十 C( 和 矩阵 相 加 的 结合 律 ) 
A—B=A+(—B) =— (B— A) 


A—A=0 
A—0=A 
—(-A=A 


(A+B) = A’+B’ 
一 个 (m Xn) 阶 的 矩阵 A 与 一 个 纯 量 c 的 乘积 为 B= cA, 其 中 , bj = cay. 
续 前 例 ,我 们 得 到 : 
== 3 6 
F =3XB= | | 


(2X3) 9 0 = 12 


纯 量 与 矩阵 的 乘积 遵循 如 下 法 则 : 
cA = Ac (交换 律 ) 
A(b+c) = Ab + Ac ( 纯 量 分 配 律 ) 
c(A 十 B)= cA 十 cB (矩阵 分 配 律 ) 


0A = 0 
1A=A 
(一 1])A 王 一 人 


其 中 ,5b、c、0、1 和 一 1 都 是 纯 量 ,A、B 和 0 为 同 阶 和 矩阵 。 
两 个 元 向 量 的 内 积 (或 者 点 乘 ) 为 一 个 纯 量 , 它 是 通过 相 加 相对 应 向 量 元 
的 乘积 得 来 的 。 


例如 ， 
一 


6 
[2s O; ly 3.) = 2(—1)+ 0(6)4+ 1(0)4+ 309) = 25 
0 


9 


HAERE A 的 列 数 与 矩阵 B 的 行 数 相等 时 ,我 们 说 矩阵 A 和 和 矩阵 B 是 乘法 相 适 
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的 。 因 此 , 当 A 为 nX n) 阶 ,B 为 (nX p) 阶 时 ,矩阵 A 和 B 乘 法 相 适 (如 下 例 )。 


但 是 以 下 矩阵 却 不 乘法 相 适 : 
1 0 0 
T 2s 
0 1 Q 
4 5 6 
0 1 (2X3) 


(3X3) 


让 C = AB 作为 矩阵 ALPE B 的 乘积 ; 让 a 代表 A 第 i 行 ,b; 代表 B 第 7 


列 , 那 么 ,我 们 知道 ,C 就 是 一 个 On X p) 的 矩阵 , 且 c = als b = X) aby. 
请 看 下 面 几 个 例子 ， 


=> 100 
1 2 3 © i © 
4.5 6 00 1 


(2X3) (3X3) 


es 1000+ 2(1)+300), nie road 
4(1)+500)+ 600), 4€004+5(1)+600), 4(0) 十 5C0) 十 6(1) 
(2x3) 


el 
Ws 


= LB + Bix tpt 十 Bx 


T3 
(4X1) 


le als i 
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> g2 1 0 
| -| | [1.4] 
| 二 二 0 1 
3 





在 第 一 个 例子 中 ,箭头 表示 左边 矩阵 里 的 元 素 如 何 与 右边 矩阵 里 的 元 素 相 乘 。 
和 矩阵 乘法 遵循 结合 律 , ABC) = (ABDC, 其 分 配 律 同 加 法 相似 : 


(A+ B)C = AC 十 BC 
A(B+C)= AB+ AC 


但 是 它 又 不 是 广义 上 的 可 交换 : 如 果 A 为 (mXn) NBH aX p) 阶 ,乘积 AB 
如 之 前 所 定义 是 可 结合 的 ,但 是 BA 要 乘法 相 适 必须 满足 m = p 。 即 便 满足 了 
这 个 条 件 ,AB 和 BA 的 阶 也 可 能 不 同 。 而 且 即 使 A 和 B 同 阶 且 都 为 (2 x 2)， 
即 乘积 AB 和 BA 的 阶 也 相同 ,但 是 所 得 矩阵 仍然 不 同 ,这 点 可 参见 方程 1. 3。 
除非 A 与 B 如 方程 1.4 所 示 , AB = BA, 我 们 可 以 说 ,A 与 B 的 乘积 满足 交换 
律 ,否则 轻易 下 结论 说 AB = BA 是 错误 的 。 然 而 , 纯 量 可 以 在 矩阵 乘积 中 随意 
摆 放 而 不 影响 计算 结果 : cAB = AcB = ABc, 

单位 矩阵 和 零 矩 阵 在 抢 阵 的 乘法 中 扮演 着 非常 重要 的 角色 ,因为 它 与 含有 
数字 0 和 1 的 纯 量 运算 相似 。 


= 0 


(mXn) (nXp) (mXp) 


(qXm) (mXn) (qXn) 


矩阵 乘积 还 有 一 个 性 质 在 纯 量 运算 中 没有 , 即 CAB)’ = B'A, 两 矩阵 之 积 的 转 
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置 是 它们 顺序 相反 的 转 置 之 积 。 这 可 推广 为 : 


(CAB.…EF) 一下.…B'A 








一 个 矩阵 的 平方 是 它 和 它 本 身 的 乘积 , 即 A? = AA, A® = AAA = AA?’ 
APA ,以 此 类 推 。 如 果 B? = A, 那么 我 们 就 可 以 说 B 是 A 的 平方 根 ,或 者 我 们 可 
以 将 B 写 成 A”, 与 纯 量 计算 不 同 ,一 个 矩阵 的 平方 根 不 是 唯一 的 ， 当然, 纯 量 
的 平方 根 也 不 是 唯一 的 ,但 区 别 仅 在 于 符号 。 如 果 A = A, 那么 ,我 们 称 A 为 
“等 宕 元 ”。 在 纯 量 运算 中 ,依照 惯例 , Ao = 工 (其 中 ,I 与 A 同 阶 )。 和 矩阵 A 的 逆 
矩阵 记 为 A ,其 矩阵 元 素 并 不 等 于 {1/as }。 

为 了 便于 讲解 和 矩阵 的 加 法 减法 及 乘法 ,我 们 常常 把 分 块 矩 阵 的 子 矩 阵 看 
做 矩阵 里 的 元 素 , 只 要 这 些 元 素 分 割 恰当 。 例 如 ， 














QI QI2 413 | au Q15 
An 
A= Q21 A22 G23 | 024 az | = 
a31 Q32 G33 | Q34 G35 = 
并 且 ， 
bu biz big |bu bs 
11 
B= ba bz bzs | ba bos al 
bn ba Big | bee Bas 
那么 ， 
Ay 十 Bu Ar + Bry 
A 二 B= 
A2 + B2 Az + Bz 
同样 ,如 果 


Aw 
(mXq) 
Azz 
(nXq) 


By 
(pXs) 
By 
(qXs) 
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An Bı + A Bz | Au By + A Bz 


AB 
i An Bu + Az» Ba | Aoi By TT Axe Bz 








根据 矩阵 的 定义 ,我 们 可 以 把 纯 量 方程 组 用 和 矩阵 方程 来 表示 。 考 虑 下 面 含 
有 两 个 未 知 变量 (zi， zx; ) 的 线性 方程 组 : 


2zi 十 5zx2 = 4 
xı F 3x: = 5 


这 些 方程 之 所 以 为 线性 ,是 因为 其 相 加 之 和 为 常数 (如 第 一 个 方程 的 右边 ) ,而 
且 方 程 左边 均 是 常数 和 一 次 变量 的 乘积 (如 第 一 个 方程 左边 的 第 一 项 2zi ) 。 

2zl 十 5zz = 4 Al x) +322 一 5 这 两 个 方程 分 别 代 表 一 个 二 维 坐标 空间 。 我 
们 可 以 把 以 上 方程 组 用 和 矩阵 方程 来 表示 ,得 到 : 


| | H i 
1 allal lg 
A x = b 
(2X2) (2x1) (2X1) 


其 中 ， 


有 关 线 性 方程 组 的 组 成 和 解法 会 在 后 文中 给 予 详解 。 
逆 和 矩阵 


在 纯 量 计算 中 ,除法 是 解 简单 方程 的 重要 工具 ,例如 ， 
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其 中 , 二 = 6 即 纯 量 6 的 倒数 。 


在 矩阵 计算 中 ,没有 直接 的 除法 ,但 是 大 多 数 方形 矩阵 都 有 逆 和 矩阵。 一 个 
方形 抢 阵 的 逆 矩 阵 [ 吕 是 一 个 同 阶 的 方形 矩阵 , 记 做 A-:。 它 有 如 下 性 质 : 
AA” 二 A "A 二 I 如果 方形 矩阵 可 逆 , 则 称 其 为 “ 非 奇 异 矩 阵 ”( 当 数学 家 第 一 次 
遇 到 非 零 且 不 可 逆 的 矩阵 时 ,他 们 发 现 这 种 矩阵 存在 的 数量 显著 ,因此 称 这 种 
性 质 为 “奇异 性 ?) 。 如 果 一 个 矩阵 存在 逆 矩 阵 ,那么 它 就 具有 唯一 性 。 对 于 一 个 
方形 矩阵 A, AB = I, 那么 必然 有 BA = I, 因此 B= A .请 看 一 个 非 奇异 矩阵 : 


bal 


ERD : 


我 们 可 以 证 明 : 

[2 | 3 3 pl 1 

a alil-a zl ole 

[ 3 p f i fl i 

3 allt 3] lõa 
在 纯 量 代数 中 ,只 有 0 没有 倒数 。 我 们 接 下 来 举 一 个 关于 非 零 奇异 和 矩阵 的 

列子 ,假设 B 为 矩阵 A 的 逆 和 矩阵 ， 
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但 是 ， 
|, | | 11 a 5 “| 
AB = = Al 
0 0 21 bz 0 0 
这 与 假设 相悖 ， 因 此 ,我们 说 A A 
寻找 非 奇 异 方形 和 矩阵 的 逆 和 矩阵 有 很 多 方法 ,在 这 里 ,我 来 简单 介绍 一 种 方 
法 一 一 高 斯 消去 法 。 尽 管 在 计算 机 执行 时 许多 方法 都 可 以 提供 精确 的 结果 ,但 


是 消去 法 使 用 起 来 较 简 单 , 且 在 应 用 范围 上 也 超出 了 和 矩阵 求 逆 ( 这 一 点 我 们 在 
后 面 的 内 容 中 会 有 所 提 及 )。 现 在 我 们 以 如 下 和 矩阵 为 例 : 


=% 0 
p =] 1 
4 4 一 人 


首先 把 该 矩阵 与 单位 矩阵 合并 , 即 构造 一 个 分 块 或 者 增 广 矩 阵 : 


[1.5] 





a =Z O}1 0 0 
1: =] 1/0 ft 9 
4 4 —4/0 0 1 


然后 ,我们 试图 通过 以 下 操作 把 原来 的 矩阵 变 为 单位 矩阵 : 


FF1: 用 一 个 非 零 纯 量 与 矩阵 的 任意 一 行 相 乘 。 
Ey :把 矩阵 中 菜 一 行 的 倍数 加 到 另 一 行 上 。 
En :交换 两 行 。 


El、Eu 和 En 被 称 为 “初等 行 操作 ”。 

从 第 一 行 开始 ,我 们 对 每 一 行 轮流 进行 初等 行 操作 , 同时 保证 对 角 线 上 的 
元 素 不 能 为 0, 如 果 遇 到 对 角 线 元 素 为 0 的 情况 ,我 们 可 以 把 对 应 的 那 一 行 移 到 
下 一 行 ,然后 用 行 元 素 除 以 这 一 行 的 对 角 线 元 素 (该 元 素 也 称 为 “ 主 元 ”)。 最 
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后 ,用 这 一 行 的 倍数 加 上 另外 的 行 ,以 消除 其 他 行 对 角 线 元 素 以 外 的 非 零 元 素 。 
具体 过 程 如 下 所 示 : 
1. 增 广 矩阵 第 一 行 除 以 2， 


= 1 
下 
一 证 | 这 了 
4 4-4/0 01 


2. 第 二 行 减 去 第 一 行 ’ 


1 
1 —1 0| 3 0 0 





1 
tl. Lies 1 
4 4 一 4| 0 01 
3. 用 第 三 行 减 去 4 再 乘 以 第 一 行 ， 
i a 
| 


1 
0 0 Lie 10 


0 8 —4]|—-2 å 姑 

4. 由 于 第 二 行 对 角 线 元 素 为 0, 所 以 将 第 二 行 , 第 三 行 交换 ， 
3 i 

Ll ©) | a @ 


0 8 -—4)/—2 01 











5. 第 二 行 除 以 8， 





a i 
L= a 7 9 «0 
1 1 1 
GS Ls rae: 
1 
0 0 1 z 1 j 
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6. 第 一 行 加 第 二 行 ， 





工 | 4 1] 

DA ET 4 ° 8 

1] ak 1 

i 
—1 

00 1 zi?) 





pd tas 
0 0 1j/-5 1 0 
8. 第 三 行 乘 以 方 再 加 第 二 行 ， 
mo o 0 4 4 
TETE 
o o iļ-4 1 0 








当 原先 的 矩阵 变 为 单位 矩阵 时 , 增 广 矩 阵 的 最 后 3 列 即 包含 原先 矩阵 之 逆 
阵 ,我 们 可 以 通过 以 下 步骤 来 证 明 : 


| 

=2 O 1 0 0 
ee ae 

L = EEEIEE 

本 |， 0 1 
ae 





解释 消去 法 可 行 性 的 方法 很 简单 :每 个 初等 行 操作 都 可 以 用 一 个 矩阵 乘法 
来 表示 。 因 此 , 当 我 们 要 交换 第 二 行 和 第 三 行 时 ,我 们 只 需 在 原 矩 阵 的 左边 乘 
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以 以 下 矩阵 : 


1 0 0 
Er = | 0 l 
1 0 


步骤 中 包含 一 系列 p AAHAS MC A, Ij 的 初等 行 操作 ,我 们 可 以 
写成 : 
E- EELA, L]= LL, B] 
HE: 来 表示 第 i NRE. EN E S E, EE, , B EA = I, (ÈR T E= A”), 
EI, = B, Alt, B= E = A`. 如果 人 A 为 奇异 矩阵 ,那么 , 它 就 无 法 通过 初等 行 操 
作 变 换 为 单位 矩阵 I。 在 该 过 程 中 , 非 零 主 元 不 存在 。 


和 矩阵 逆 阵 遵循 以 下 法 则 ， 
i=] 
(A7) =A 
(AY? = A7) 
(AB)! = BA 
(cA) c A 


SEP ABN n BARA TERE c 为 非 零 纯 量 。 如 果 D = diag(di， doy =+, dy), 
EIH di A 0, 那么 D 是 一 个 非 奇异 矩阵 , D = diag( 方 , 证，…, 证 ). 最 
JA IE aT SP OE LTE 

行列 式 


对 应 于 每 个 方形 矩阵 A, 都 有 一 个 称 为 “矩阵 行列 式 ” 的 数 ,这 个 数 记 做 
det A。[2] 对 于 一 个 (2 X 2) 的 矩阵 ,其 行列 式 可 表示 为 det A = CQ11Q22 — 412421 o 
对 于 一 个 (3 xX 3) 的 和 矩阵 ,其 行列 式 可 表示 为 : 


det A = 411422433 — 411423432 十 Qi2G23Gal — 1221 033 + azaz a32 — @13 422431 


尽管 对 于 nn 阶 方形 矩阵 的 行列 式 有 一 个 广义 的 定义 ,但 是 我 觉得 ,用 以 下 性 质 
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(或 定理 ) 来 描述 行列 式 更 简单 : 


D1: 如 果 用 纯 量 常数 乘 以 矩阵 A 的 某 一 行 ,那么 矩阵 的 新 行列 式 则 为 
原来 行列 式 与 该 常数 的 乘积 。 

D2: 如 果 把 和 矩阵 A 某 一 行 的 若干 倍加 到 另 一 行 , 行 丈 

D3 :交换 矩阵 A 的 任意 两 行 会 改变 行列 式 的 符号 

D4; detI = 1 


= 


式 值 不 变 。 


定理 Dl、D2 和 D3 指出 了 3 种 初等 行 操作 对 行列 式 的 影响 。 由 于 上 述 高 斯 消 
去 法 可 将 一 个 方形 矩阵 转变 为 单位 矩阵 ,因此 ,这 些 性 质 加 上 定理 D4, 已 经 可 以 
充分 确定 行列 式 的 值 。 行 列 式 可 以 简单 地 通过 主 元 乘积 得 到 ,在 消去 过 程 中 ， 
如 果 使 用 了 一 次 偶数 行 交换 , 则 要 在 乘积 前 面 加 负 号 。 如 方程 1. 5, 其 行列 式 等 
于 一 (2)(8)(1) =— 16, 因为 在 第 四 步 有 一 个 行 交 换 ( 第 二 行 和 第 三 行 ) ,通过 步 
又 1 步骤 5 及 步骤 7, 我 们 知道 矩阵 主 元 分 别 为 2、8 和 1。 如 果 和 矩阵 为 奇异 矩 
阵 , 那 么 则 有 一 个 或 者 一 个 以 上 的 主 元 为 0, 因 此 行列 式 为 0。 相 反 , 对 于 一 个 非 
奇异 矩阵 ,其 主 元 不 可 能 为 0。 

行列 式 有 时 会 在 统计 应 用 中 直接 出 现 , 例 如 ,出 现在 多 元 正 态 分 布 的 公 
式 中 。 


克 罗 内 克 积 


假设 A 是 一 个 mxXn 阶 矩阵 ,B 为 一 个 pXg 阶 和 矩阵。 那么 A 和 B 的 克 罗 内 
克 积 记 做 AC9B ,定义 为 : 


auB awB QI B 

anB azB Q2,B 
pl ; 

âm B am B e AmB 


由 于 克 罗 内 克 积 可 以 表示 分 块 矩 阵 ,因此 在 统计 中 非常 有 用 。 例 如 ， 
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o 010 Olo: ó] 


克 罗 内 克 积 的 许多 性 质 与 普通 矩阵 相似 ,尤其 是 ， 
A® (B+C) =A@B+AQC 
(B+C) M®@A=BWA+CWA 
AQB ®D=ASK BA D) 
c(A® B) = (cA) QB = A Q (cB) 


其 中 ,了 和 C 为 同 阶 矩 阵 ,c 为 纯 量 。 如 同 矩 阵 乘 法 , 克 罗 内 克 积 不 具 交 换 性 ,从 
LEB AO BABA. AH FRM A- B C AD, 
(A ®B)(C@ D) = AC Q BD 
如 果 A B 为 非 奇异 矩阵 ,那么 ， 
AQB) =A QB 
因为 ， 
AQB OB) = (AAT) O (BB") = L O n = Lm 
最 后 ,对 于 任意 矩阵 A 和 B， 
AQB = A’ QB 
对 于 分 别 具 有 mAn 阶 的 方形 矩阵 A 和 B， 


trace(A ®) B) = trace(A) X trace(B) 
det(A &) B) = (det A)” (det B)” 


社会 统计 的 数学 基础 


基础 几何 向 量 


在 代数 中 , 向 量 为 只 含有 一 列 ( 或 者 一 行 ) 的 矩阵 。 其 几何 解释 为 : 向量 
x 二 [Xx1， t, t ty], RAN n 维 笛 卡尔 坐标 空间 中 的 零点 到 (由 向 量 元 决定 
的 ) 终 点 的 有 向 线段 。 有 关 二 维 或 三 维 空间 的 向 量 例子 ,请 参见 图 1. 1。 








注 :每 个 向 量 都 是 一 个 以 0 为 起 点 的 有 向 线段 ,其 终点 由 向 量 元 决定 。 
图 1.1 几何 向 量 举例 :(a) 二 维 平面 ;(b) 三 维 空间 


有 关 向 量 基本 算术 的 几何 说 明 非 常 简单 ,已 
知 长 度 和 方向 ,我 们 就 可 以 确定 一 个 向 量 ,不 论 其 
起 点 是 不 是 在 坐标 零点 。 两 个 向 量 x, x 相 加 ， 
只 要 使 其 中 一 个 向 量 x 平移 到 其 终点 与 男 一 个 向 
量 x 的 起 点 重合 ,此 时 所 得 的 以 的 起 点 为 起 
点 .以 x 的 终点 为 终点 的 向 量 即 为 由 加 法 所 得 的 
向 量 , 同 时 ,该 平移 向 量 的 长 度 与 方向 (与 所 有 坐 
标 轴 所 成 的 角度 ) 保 持 不 变 。 图 1. 2 在 二 维 坐标 注 :把 其 中 一 个 向 量 平移 到 其 终 

点 与 另 一 个 向 量 的 起 点 相 重 
系 里 描述 了 向 量 加 法 的 操作 。 它 等 同 于 以 MK. x 合 构成 一 个 平行 四 边 形 ,以 

Jetis. BARGE 坐标 0 点 为 起 点 的 对 角 线 即 
为 邻 边 作 平行 四 边 形 ,以 坐标 0 点 为 起 点 的 对 角 ear 
线 即 向 量 x, 、x 的 和 。 12 ”两 个 向 量 相 加 
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a 在 图 1.3 H, iE x x 的 差 表示 为 以 x 的 终点 为 起 
Rx 的 终点 为 终点 的 向 量 ,那么 ,如 果 是 求 向 量 x 一 x 的 
差 , 则 该 向 量 的 方向 为 从 x 到 x o 
” 向 量 x 的 长 度 用 | x || RER, SPE BP A 
数 平方 根 : 


n 
Ixl =,/ X) z 
X:—X; i=l 


图 1.3 向 量 x% 一 % 该 方程 在 二 维 平面 中 遵循 勾 股 定理 ,如 图 1. 4(a) 所 示 。 该 结 








SARS Spon AT LAE HS = Es AIA IP 1. 4(b) 所 示 。 向 量 
x 和 向 量 xp OBES WAN a BRA ABS RRA Nx 一 六 | = lx 
x, || (如 图 1. 3). 

AE 
0 m 





(a) 
注 :其 中 ,(a) 与 (b) 分 别 为 向 量 长 度 在 二 维和 三 维 空间 的 表示 。 
图 1.4 向 量 长 度 是 其 坐标 平方 和 的 平方 根 (表示 为 | x| 一/ > ) 


纯 量 a 和 向 量 x 的 乘积 向 量 ax 长 度 为 |a| X || x ||, 证 明 过 程 如 下 : 
| ax || = VV >) (ar)? 
= fe Sa? 


= |a|x lxl 
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如 果 纯 量 a 为 正 , 那 么 向 量 ax 与 向 量 x 同 向 ;如 果 a 为 负 , 那 么 向 量 ax 与 向 量 x 
共 线 但 是 方向 相反 。 向 量 一 x 可 以 看 做 纯 量 (一 1) 和 向 量 x 的 乘积 ,因此 ,向 量 
一 x 的 长 度 与 x 相同 ,只 是 方向 相反 。 这些 结果 我 们 都 可 以 在 图 1. 5 中 看 到 。 





1.5x=(4.5,3y 


—x=(—3,—2)’ 


注 :其 中 ,向 量 ax 与 向 量 x 共 线 。 如 果 a >o, 那么 向 量 ax 与 向 量 x 同 向 ;如 果 a 二 0, 那么 向 量 ax 与 
向 量 x 反 向 。 
图 1.5 向 量 ax 在 二 维 坐标 平面 内 的 表示 


向 量 空间 与 子 空 间 


n 维 向 量 空间 是 所 有 向 量 x 二 (zi，z，…，z) 的 无 限 组 合 , 且 其 坐标 zi 
可 以 是 任意 实数 ,因此 我 们 可 知 ,一 维 向 量 空间 即 一 条 直线 ,二 维 向 量 空 间 为 一 
个 平面 等 等 。 

n 维 向 量 空间 的 子 空间 是 由 空间 中 含有 k 个 向 量 {x, xz,，…, x ) 的 向 量 
空间 子 集 y 生成 的 ,该 生成 集合 y 的 线性 组 合 形式 为 : 


| + a2 Xo 十 … + aX 


HER {xs x, cet Xe) 分 布 于 整个 子 空间 ,我 们 知道 ,其 实 每 个 x , xz ors Xe 
都 是 一 个 由 个 坐标 向 量 组 成 的 向 量 ,也 就 是 ，{xi ,xz，…, KD FER 个 向 量 的 
集合 ,而 不 是 一 个 包含 & 个 坐标 向 量 的 向 量 。 

如 果 该 向 量 集合 (x, x, vty Xe) 中 的 任何 一 个 向 量 都 无 法 表示 为 其 他 任 
意向 量 的 线性 组 合 , 那 么 ,我 们 说 该 向 量 是 几何 上 线性 独立 的 。 


X; = QIKXI 十 seis +a; Xm + a;X; 十 … 十 akXx [1. 6] 
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其 中 ,一 些 常 数 w 可 为 0。 同样 ,我 们 可 以 说 ,如 果 不 存 在 不 全 为 0 的 常数 b， 
boy tts Dy 使 得 
bixi 十 px 十 … + Xe = 0， [1.7] 


那么 ,该 向 量 集合 线性 独立 。 方 程 1. 6 和 方程 1. 7 则 被 称 为 “线性 相关 ”或 者 “ 共 
线性 方程 ”。 当 向 量 集合 符合 这 两 个 方程 时 , 则 我 们 称 该 集合 为 “线性 相关 集 
合 ”。 注 意 ,由 于 0 = Ox, 因此 零 向 量 与 任何 向 量 都 存在 线性 相关 的 关系 。 

子 空间 的 维度 是 由 最 大 的 线性 独立 子 集 内 的 向 量 个 数 决定 的 。 因 此 ,由 向 
ERA (x, xs ty Xe) 生成 的 子 空间 维度 不 会 超过 &A 和 nn。 这 些 在 向 量 空间 
中 的 关系 可 在 图 1.6 的 三 维 坐标 系 中 体现 出 来 。 图 1. 6(a) 表 示 由 一 个 非 零 向 
量 x 生 成 的 一 维 子 空间 (直线 ); 图 1. 6(b) 表 示 由 经 x. Xe 两 个 共 线 向 量 组 成 的 


y =4,X,14,X, 


子 空间 










y=4,X,+4,x, 


子 空间 





注 :(a) 由 一 个 非 零 向 量 生 成 的 一 维 子 空间 (一 条 直线 ); (b) 由 两 个 共 线 向 量 生成 的 一 维 子 空间 ;(c) 由 
两 个 线性 独立 的 向 量 生成 的 二 维 子 空间 (一 个 平面 ); (d) 由 3 条 线性 相关 但 是 两 两 之 间 线性 独立 
的 向 量 生成 的 二 维 子 空间 。 其 中 ,(c) 和 (d) 中 生成 的 平面 可 以 无 限 延伸 ,将 平面 画 在 x 和 x 之 间 
是 表达 的 需要 。 

图 1.6 三 维 空间 的 向 量 集 生成 的 子 空间 
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一 维 子 空间 ;图 1. 6(c) 表 示 由 两 个 线性 独立 的 向 量 x,、x 组 成 的 二 维 子 空间 
(平面 ); 最 后 ,图 1. 6(d) 表 示 由 3 个 线性 相关 的 向 量 x Xe Xs 生成 的 二 维 子 空 
间 。 在 最 后 一 个 例子 中 , 任意 一 个 向 量 都 会 落 在 由 其 他 两 个 向 量 组 成 的 平 
面 中 。 

一 个 线性 独立 的 向 量 集 OX. Xe oy Xe}, 如 图 1. 6(a) 中 的 {x} 和 图 1. 6(c) 
中 的 (xr. x} , 均 可 以 看 做 向 量 集 所 扩张 出 的 子 空间 的 基 。 空 间 内 的 每 个 向 量 
都 能 以 唯一 的 方式 表达 成 这 些 基 向 量 的 线性 组 合 : 


y= CX) 十 czXz +s + KX 


常数 c，c，…， Ce 被 称 为 “y 的 坐标 值 ”。 因 为 0 二 0x +0x, 十 … 十 0x， 所 以 零 
向 量 可 以 存在 于 任何 子 空 间 。 

一 个 二 维 子 空间 的 向 量 坐 标 可 以 根据 向 量 加 法 中 的 平行 四 边 形 法 则 找 出 
(如 图 1. 7)。 我 们 还 可 以 通过 线性 联 立方 程 组 得 到 具体 坐标 值 ,其 中 ,cu， 
Cos tty Ce 为 未 知 量 。 
= CX ezg + te + Cex, 


C1 
C2 
= Cx» Xaa ey x, | 
Ck 
一 X c 
CXR) (EX1) 
C2 Xp y 
X, 
o cX; Xx) 


17 通过 向 量 加 法 的 平行 四 边 形 法 则 得 到 的 以 (xi ，xs} 为 基 的 向 量 y 的 坐标 


25 


26 


| 社会 科学 中 的 数理 基础 及 应 用 


当 向 量 集 tx Xe 5 cory Xe) 中 的 向 量 是 线性 独立 的 时 候 , 和 矩阵 X 为 列 满 秩 矩阵 ， 
此 时 ,方程 组 有 唯一 解 。 有 关 轶 的 概念 和 系统 线性 联 立 方程 组 的 解法 ,我 们 会 
在 之 后 介绍 。 


正 交 与 正 交 投影 
我 们 知道 ,两 个 向 量 的 内 积 等 于 它们 对 应 坐标 的 乘积 之 和 : 
X。y 一 Dz 


如 果 两 个 向 量 x、y 正 交 (垂直 ) ,那么 它们 的 内 积 为 0。 有 关 正 交 的 基本 几何 向 
量 可 参见 图 1. 8。 尽 管 向 量 x 和 y 均 存在 于 一 个 nn 维 空间 中 (因此 有 些 我 们 可 
能 无 法 直接 观测 到 ) ,但 按照 惯例 ,我 一 般 将 其 画 在 一 个 二 维 平面 坐标 里 .i 引 如 
图 1. 8(a) 所 示 , 当 向 量 x 和 y 正 交 时 ,顶点 分 别 为 (0, x, x 十 y) 和 (0, x, x 一 y) 的 
两 个 直角 三 角形 是 全 等 的 。 因 此 ，|| x 十 yl = x-y]. 由 于 向 量 的 长 度 为 该 
向 量 与 其 本 身 的 内 积 的 平方 根 , 于 是 我 们 有 : 
(x+y) « (x+y) = (x—y) « (x—y) 
X。X 十 2xX。y 十 y。y 一 X。X 一 2x。y 十 yY。y 
4x。y 一 0 
X。y 王 0 


相反 , 当 x 和 y 不 正 交 时 ,那么 | x+y| Æ || x—yl] , 则 x。y 关 0。 


y x+y 
y x+y 
x 
—y x—y =y x—y 


(a) (b) 
注 :(a) 当 向 量 x, y 正 交 时 ,它们 的 内 积 x，y 等 于 0; (b) 当 两 向 量 不 正 交 , 那 么 它们 的 内 积 不 等 于 0。 
图 1.8 正 交 的 基本 几何 向 量 
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向 量 y 在 向 量 x 上 的 正 交 投 影 可 看 做 向 量 x 与 一 个 纯 量 的 乘积 ,那么 ， 
(y 一 9) 与 x 正 交 。 正 交 投影 的 几何 表示 请 见 图 1. 9。 通过 平行 四 边 形 法 则 ( 见 
图 1. 10) ,了 的 终点 是 向 量 x 方向 上 与 向 量 y 的 终点 距离 最 近 的 点 。 为 了 找到 
正确 的 纯 量 5, 我 们 有 : 

x. (y—ĵ) =x. (y—bx) = 0 


因此 , x» y— bx. x= 0, ABA, b= (x+ y)/(x- x), 


A 人 


ax $=bX cx 
图 1.9 向 量 y 在 向 量 x 上 的 正 交 投影 人 = bx 图 1.10 向 量 y 在 向 量 x 上 的 正 交 投影 9 = 
bx (其 终点 为 与 向 量 y 的 终点 距离 最 近 的 点 ) 

当 正 交 的 定义 可 以 延伸 到 矩阵 中 时 , 则 有 : 若 矩 阵 的 列 向 量 两 两 正 交 , 即 
当 X'X 为 对 角 和 矩阵 时 [4 ,矩阵 X 为 正 交 和 矩阵。 所 以 ,如 果 和 矩阵 X Oy TE BOK 
阵 , 其 符合 XX = I. 

向 量 y 在 x 上 的 正 交 投影 可 以 通过 余弦 值 算出 两 个 向 量 之 间 的 夹 角 。 由 于 
余弦 函数 在 w 二 0 上 中 心 对 称 ,因此 在 任意 方向 上 测量 夹 角 都 可 以 。 这 里 ,我 简 
单 地 把 所 有 夹 角 都 视 为 正 值 。 有 关 余 弦 及 其 他 三 角 函 数 的 讨论 请 见 后 文 。 我 
将 夹 角 类 型 大 概 分 为 两 种 :两 向 量 之 间 的 夹 角 在 0 和 90 之 间 ; 两 向 量 夹 角 在 
90" 和 180" 之 间 。1 中 对 于 第 一 种 类 型 . 

















oon wr bial ee y el Ray 
j ll y lI ly |l Ix? Ty Ixi x yl 
对 于 第 二 种 类 型 ; 
cos w ly _ olx| oy: 
Il yl ll y Il Ix ll x yl 
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对 于 以 上 两 种 情况 ,向 量 y 在 x 上 的 正 交 投 影 的 5 的 符号 反映 了 cos w 的 符号 。 


x 
j= x 


(a) (b) 
iE: (a) 0° << w< 90°; (b) 90°< w< 180°, 


图 1.11 向 量 x 与 y 的 夹 角 


在 一 个 由 向 量 集合 (2 ，x，…， Xe) 扩张 出 来 的 子 空间 中 ,向 量 y 的 正 交 
投影 可 表示 为 向 量 %( = 1, 2, ++, k) 的 线性 组 合 。 因 此 ,(y 一 了 ) 与 该 向 量 集 
里 的 所 有 向 量 x; 都 正 交 。 


$ = bixi bx 十 … 十 px 


WR k = 2, 该 正 交 投影 的 几何 表述 可 参见 图 1. 12。 在 由 该 向 量 集 扩张 出 来 的 
子 空间 里 ,向 量 9 的 终点 为 在 向 量 x 方 向 上 与 向 量 y 的 终点 距离 最 近 的 点 。 





图 1.12 向 量 y 在 由 向 量 x,、x; 扩张 出 来 的 子 空间 (平面 ) 上 的 正 交 投影 f 


我 们 用 一 个 向 量 b 包含 所 有 常数 5b ,同时 把 所 有 向 量 x 放 入 一 个 (n X k) 
EE X = [xi x, x JF, 因此 ,我 们 有 y = Xb, 根据 正 交 投影 定义 ,得 到 : 


x e (y— ĵ) 一 X。(y 一 Xb) = 0 G=1, =, k) [1.8] 
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同 理 , X (y 一 Xb) =0, X'y =X'Xb, 只 要 X'X 为 非 奇 异 矩 阵 , 我 们 就 可 以 找到 符 
合 该 方程 的 唯一 的 b。 对 于 基 向 量 , 只 要 (x, x ，…, x } 线 性 独立 , 则 X X 为 
非 奇 异 和 矩阵 ,b 有 唯一 解 ,否则 ,b 的 解 不 唯一 。 

有 关 正 交 投 影 在 最 小 二 乘 线性 回归 中 的 应 用 非常 直接 。 假 设 图 1. 9 和 图 
1. 11 中 的 向 量 x 是 一 个 简单 回归 里 的 自 变量 ,向 量 y 为 因 变量 ,对 于 x 和 Yy 我 们 
都 用 (每 个 变量 与 其 均值 的 ) 偏 差 来 表示 , 则 有 x = {X; 一 X}, y= {Y; 一 了 )。 
那么 , 9 =bx AVY Xt X 进行 最 小 二 乘 线 性 回归 后 ,通过 Y 值 拟 合 得 到 的 平均 偏 
差 向 量 ;6 为 斜率 , y 一 》 为 最 小 二 乘 残 差 向 量 。 根 据 平行 四 边 形 法 则 ,我 们 发 
现 ,Y 的 总 平方 和 可 以 分 解 为 回归 平方 和 和 残 差 平方 和 , 即 

ly? = 9+ iy- $ WV? 

或 者 叫做 回归 的 “方差 分 析 ”。 那 么 ,x 和 yy 之 间 的 相关 系数 7 就 是 它们 平均 偏 
差 向 量 夹 角 的 余弦 值 。 

同样 ,在 一 个 多 元 回归 中 ,我 们 假设 y 为 因 变 量 的 平均 偏差 向 量 ,x, 和 x 为 
两 个 自 变量 的 平均 偏差 向 量 ,那么 ,Y 对 x 和 x 的 最 小 二 乘 线性 回归 则 如 图 
1.12 所 示 。 其 中 ,b, Mo 为 两 个 自 变 量 的 偏 回归 系数 。 由 原点 .y 及 了 组 成 的 
直角 三 角形 给 出 了 多 元 回归 中 的 方差 分 析 。y 与 ?之 间 夹 角 的 余弦 值 则 为 回归 
得 出 的 尺 , 即 观测 的 Y 与 回归 拟 合 出 的 Y 的 相关 性 大 小 。 


息 阵 的 秩 及 线性 联 立 方程 组 的 解法 


和 矩阵 的 秩 





Cm Xn ) 和 矩阵 A 的 行 空间 是 n 维 向 量 空间 的 子 空间 ,该 子 空间 是 由 和 矩阵 A 
的 m 行 向 量 生 成 的 。 和 矩阵 A 的 秩 即 其 行 空间 维 数 , 换 句 话说 ,矩阵 A 的 秩 是 最 
大 线性 独立 行 数值 。 它 遵循 rank(A) < min(m, n). 

例如 ,矩阵 的 行 空 间 


29 


社会 科学 中 的 数理 基础 及 应 用 
æ | 


1 0 0 
A= 
0 1 0 


x 二 a[l, 0, 0] 十 6b[0, 1, 0] 


包含 的 所 有 向 量 为 : 


= [rid 0] 


该 子 空间 维 数 为 2, 因 此 rank(A) =2, 
如 果 一 个 矩阵 为 行 简化 阶梯 形 矩 阵 RREF ,那么 , 它 必须 符合 以 下 标准 : 


R1: 如 果 算 阵 中 包含 零 行 , 零 行 必须 排 在 非 零 行 后 面 。 

R2: 从 左 到 右 , 每 个 非 零 行 的 首 非 零 元 都 为 1。 

R3: 若 第 m 行 的 首 非 零 元 位 置 在 k 列 ,那么 ,第 m 十 1 行 的 首 非 零 元 位 
置 则 在 十 1 列 。 

R4: 首 非 零 元 所 在 列 的 其 他 元 均 为 0。 


方程 1. 9 形象 地 列 出 了 行 简化 阶梯 形 和 矩阵 ,其 中 , 星 号 表示 所 在 元 素 的 任 
意 值 : 








ro ... 0 1 关 see x 0 关 eee 关 0 关 eee x] 
0 eee 0 0 0 eee 0 1 x eee * 0 关 eee 关 AEB 
0 0 © O © © 0 C Hk: * [1.9] 
0 0 0 0 0 0 0 0 0 0 0| At 

LO 0 0 0 0 oO 9 0 0 O ,| 





行 简化 阶梯 形 和 矩阵 RREF 的 秩 和 矩阵 中 的 非 零 行 数目 相 等 , 首 非 零 元 所 在 
列 的 其 他 元 均 为 0 的 性 质 ,保证 了 任意 非 零 行 不 可 能 成 为 其 他 非 零 行 的 线性 


组 合 。 
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通过 一 系列 初等 行 操作 ,我 们 可 以 把 一 个 矩阵 变 为 RREF。 例 如 ， 


=—2 0 =I. 2 
4 0 1 0 
6 0 1 2 

L ”二 
1 0 2 1 
4 0 1 0 
6 0 1 2 


3. 第 三 行 减 去 6 再 乘 以 第 一 行 ， 


L ， 
10 3 1 
00-1 4 
0 0 —2 8 

4, 第 二 行 乘 以 一 1， 

1 
Lo 1 
00 1 一 4 


5. 第 一 行 减 去 去 再 乘 以 第 二 行 ， 
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LO Q 1 
0 0 = 





oo —2 8 
6. 第 三 行 加 上 2 再 乘 以 第 二 行 ， 
Loo I 
0 0 1 一 4 
000 0 








由 于 矩阵 A 中 有 一 个 零 行 , 且 零 行 可 以 写成 其 他 行 的 线性 组 合 ,所 以 矩阵 
A 的 秩 等 于 其 行 数 减 1, 其 值 等 于 矩阵 A 的 行 简化 阶梯 形 矩 阵 (RREF) 一 一 Ar 
的 秩 。 因 此 ,我 们 可 知 , 初 等 行 操作 不 会 改变 一 个 矩阵 的 秩 。 

一 个 非 奇异 方形 矩阵 的 RREF 是 一 个 单位 矩阵 ,因此 , 非 奇异 方形 矩阵 的 
秩 等 于 其 阶 数 。 相 反 ,一 个 奇异 矩阵 的 值 比 其 阶 数 小 。 

之 前 我 们 定义 矩阵 A 的 秩 为 其 行 空间 的 维度 。 其 实 , 和 矩阵 A 的 秩 与 其 列 空 
间 的 维 数 也 相等 , 换 句 话说 ,矩阵 A 的 秩 等 于 矩阵 A 中 线性 独立 的 列 数 。 


线性 联 立 方程 组 


含有 7 个 未 知 数 的 m 个 线性 方程 组 用 矩阵 形式 可 表达 为 : 
dh a [1. 10] 
其 中 ,和 矩阵 A 是 由 未 知 数 的 系数 组 成 的 ,向 量 b 是 由 方程 等 号 右边 的 常数 项 组 
成 的 ,x 为 未 知 数 向 量 。 假 设 方程 的 数目 和 未 知 数 的 数目 相等 , 即 m = ” 或 者 
FEE A CASE at FRE ABA ,方程 1. 10 有 唯一 解 , 即 x 王 Ab。 


同 理 , 如 果 A 为 奇异 矩阵 ,那么 A 就 可 以 通过 一 系列 初等 行 操作 被 转化 为 
RREF; 


Ar = Ep: EEA = EA 
通过 对 方程 左边 和 右边 同时 应 用 行 操作 , 则 得 到 : 
EAx = Eb 


Arx = br [1.11] 
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其 中 , by = Eb 。 因 此 方程 1. 10 和 方程 1. 11 是 等 价 的 。 

以 -~ 表示 矩阵 A 的 秩 。r 二 n EMRE A 为 奇异 矩阵 ) ,Ar 包含 -个 
非 零 行 和 ?一 > 个 零 行 。 如 果 和 矩阵 Ar 的 任意 零 行 在 向 量 bx 中 的 对 应 元 不 为 0， 
那么 ,该 方程 组 是 不 一 致 的 ,我 们 称 这 样 的 方程 组 为 " 超 定 方程 组 ,因为 该 方程 
组 中 存在 自 相 矛 盾 的 方程 。 


Oa, + Ox: 十 … 十 0z, = b £0 


如 果 和 矩阵 Ar 的 任意 零 行 在 向 量 be 中 的 对 应 元 为 0, 则 该 方程 组 是 一 致 的 ,但 此 
时 该 方程 组 却 有 无 穷 多 个 解 ,其 中 ”一 "个 未 知 数 可 以 取 任 意 值 , 这 ”一 ”个 未 知 
数 又 决定 了 其 他 ~ 个 未 知 数 也 会 有 无 穷 多 个 解 。 我 们 称 这 样 的 方程 组 为 "从 定 
方程 组 ”。 假 设 方程 的 数目 小 于 未 知 数 的 数目 , 即 m< n, 那么 ,r 必然 小 于 ”该 
方程 组 既 可 能 是 超 定 方程 组 (如 果 和 矩阵 Ar 的 零 行 所 对 应 的 向 量 br 的 元 非 零 )， 
也 可 能 是 欠 定 方程 组 (如 果 方 程 组 是 一 致 的 )。 我 们 可 以 考虑 以 下 由 4 个 未 知 数 
和 3 个 方程 组 成 的 方程 组 : 


—2 O 1 1 
T2 
4 0 1 Q = |2 
T3 
6 0 1 


将 等 号 右边 的 常数 矩阵 加 入 该 矩阵 后 得 到 : 








= 0 | 
4 0 1 0 : 
6 0 1 219 


将 左边 系数 矩阵 变 为 行 简化 矩阵 的 步骤 为 : 
l. 第 一 行 除 以 = 


1 

2 2 
40 I | 2 
6 :0 2 2| 5 
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2. 第 二 行 减 去 4X 第 一 行 ,第 三 行 减 去 6X 第 一 行 ， 


E- eaid 
Le gai 5 
0 0 —1 4 4 
0 0 —2 8 8 

3. 第 二 行 乘 以 一 1， 

I a E 
Le s 1 
0 0 1 —4| 一 4 


4. 第 一 行 减 去 去 X 第 二 行 ,第 三 行 加 上 2X 第 二 行 ， 


li’ 0 0 1 -4 
0 0 yt —4| 一 4 〈 首 非 零 元 用 箭头 标 出 ) 
0 00 ol o 


写成 方程 组 形式 ,我 们 得 到 : 


Xl 十 xa 二 了 


x3 一 4z4 =— 4 
Ox, + Ox: 十 0zas 十 0z = 0 
第 三 个 方程 没有 提供 任何 有 用 的 信息 ,但 是 它 说 明了 “ 原 方程 组 是 一 致 的 ”"。 前 


两 个 方程 暗示 了 未 知 数 z! 和 xs 可 以 取 任 意 值 (我 们 用 zz 和 zi? RAN) ABA a 
和 T3 可 表示 为 : 
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因此 任意 向 量 
Tı 2 =; ] 
x= cal ay 
ee —4+ 4r; 
X4 P 
T4 | 
为 原 方程 组 的 解 。 


现在 ,我 们 考虑 男 一 个 方程 组 : 


=o -~ =] 
T2 
4 0 1 0 = 
T3 
6 0 1 2 


T4 








将 向 量 b 合 并 到 系数 矩阵 A 中 进行 初等 行 操作 后 ,我们 得 到 的 行 简化 矩阵 为 : 


0 0 0 0| 2 


最 后 一 个 方程 0z; + 0x. +02; +02, = 2 是 自 相 矛盾 的 ,因此 原 方程 组 无 解 。 
假设 方程 组 中 方程 的 数目 大 于 未 知 数 的 数目 , 即 思 >>, 如 果 和 矩阵 A 为 列 满 
IEE Cr = n), 那么 矩阵 Ar BE n 阶 单位 矩阵 和 mm 一 > 个 零 行 。 若 方程 组 是 
一 致 的 ,那么 该 方程 组 有 唯一 解 , 否 则 ,该 方程 组 为 超 定 方程 组 。 当 + 二 nn 时 , 方 
程 组 既 可 能 为 超 定 方程 组 ,也 可 能 为 欠 定 方程 组 。 
我 们 可 以 在 一 个 二 元 方程 组 .6 里 证 明 以 上 论述 : 


Qunxi 二 awzzz = bı 
a21Z1 十 azzxz = by 


a3lZ1 十 aazZz = by 
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每 个 方程 都 可 以 在 一 个 二 维 平面 坐标 系 里 表示 ,其 中 ,坐标 轴 由 两 个 未 知 
数 构成 (如 图 1. 13)。 如 果 3 条 直线 相交 于 一 点 ,如 图 1. 13(a) ,那么 方程 组 有 唯 
一 解 一 一 两 个 未 知 数 (x? 、zz ) 同 时 满足 3 个 方程 。 如 果 3 条 直线 没有 相交 于 
一 点 ,如 图 1. 13(b) 和 图 1. 13(c) ,那么 两 个 未 知 数 无 法 同时 满足 3 个 方程 ,因此 
该 方程 组 为 超 定 方程 组 。 最 后 ,如 果 3 条 直线 重合 ,如 图 1. 13(d) ,无 论 未 知 数 
取 什么 值 ,都 可 以 满足 3 个 方程 ,此 时 ,方程 组 被 称 为 “ 欠 定 方程 组 ”。 





Xz Xy 


(c) (d) 
TE: (a) 唯一 解 ;(b) 和 (c) 超 定 方程 组 ;(d) 欠 定 方程 组 (3 条 直线 重合 ) 。 
1.13 含有 两 个 未 知 数 的 3 个 线性 方程 


如 果 等 号 右边 的 向 量 b 在 线性 联 立 方程 组 里 为 零 向 量 时 ,方程 组 被 称 为 “ 齐 
次 方程 组 ”: 
x 一 0 E112] 


Ad 
那么 ,无 效 解 x = 0 总 是 符合 齐 次 方程 组 ,因此 ,方程 组 不 可 能 不 一 致 。 通 过 上 
文 的 介绍 ,我 们 知道 , 非 无 效 解 只 有 当 rank(A) <n 时 , 即 方程 组 为 欠 定 方程 组 
时 才 存 在 。 
表 1. 1 总 结 了 有 关 线性 联 立 方程 不 同情 况 下 的 解 .7] 
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线性 联 立 方程 在 统计 上 被 广泛 运用 ,例如 我 们 熟悉 的 最 小 二 乘 回归 分 析 。 
表 1.1 含有 nn 个 未 知 数 和 wm 个 线性 联 立方 程 的 解 














方程 个 数 m=n m=n m>n 
yo r&n EN r=n r<in r=n 
般 方程 系统 
一 致 KRE RE 唯一 解 RE 唯一 解 
不 一 至 超 定 超 一 超 定 超 定 
齐 次 方程 系统 





= 非 无 效 解 ”” 非 无 效 解 无 效 解 非 无 效 解 无 效 解 


Pike 


FEAT TA EW A Ta TB AE at A BE, 那么 ,对 于 所 有 和 矩阵 ,包括 奇 
Se FA BAR Tr FTE EAT A Be SC a ME SC a EE TT AE HP EE 
如 ,在 介绍 线性 统计 模型 时 非常 有 用 .18] 

(mX n) BERE A 的 广义 闭 矩 阵 为 (n Xm) 矩阵 A ,其 满足 方程 : 

AA ASA 

请 注意 ,A 是 一 个 广义 逆 矩 阵 , 而 不 是 矩阵 A 的 广义 逆 和 矩阵 。 除 非 A 是 方形 非 
奇异 矩阵 (在 这 种 情况 下 , A = A!) 否则 广义 逆 矩 阵 就 不 是 唯一 的 [9] 

许多 方法 可 以 帮助 我 们 找到 和 拖 阵 的 广义 逆 和 矩阵 ,例如 ,高 斯 消去 法 。 我 们 
先 通过 初等 行 操作 把 矩阵 A 变 为 RREF: 

EA = Ep::-E,E, A = Ag [1.13] 

其 中 ,EE 二 EEE 是 一 个 (nXm) WEA. FH AKASH ARB 
等 列 操作 ( 转 置 是 不 必要 的 ,因为 Ar 中 所 有 的 首 非 零 元 已 经 为 1) ,我 们 进一步 
将 An 简化 为 标准 形式 : 


I 
(rXn-r) 
Ac = ArE” = AR 了 E; E; = | | [1.14] 
) 


社会 的 数理 基础 及 应 用 
38 | 科学 中 的 数 


其 中 , E” 二 Er E; …E 是 一 个 (nXn) 的 非 奇 异 矩 阵 , 左 上 角 单 位 矩阵 的 阶 数 ~ 
是 矩阵 A 的 秩 , 其 他 所 有 和 零 矩阵 可 有 可 无 。 因 为 ,如 果 A 是 一 个 阶 非 奇异 矩 
E,W r= ” 那么 在 这 里 ,我 们 就 不 需要 零 矩 阵 。 

将 方程 1. 13 和 方程 1. 14 合并 ,得 到 : 


Ac = EAE’ [1.15] 
那么 ,A KI GNE RELO] : 


A =E* ACE 


—2 0 =I 
4 0 1 0 
6 0 1 


在 上 文中 ,我们 将 该 矩阵 变 为 行 简化 矩阵 后 ,得 到 :; 


LỌ- 1 
0 © 0 


WAR — Fl =F FO PO TCR IAS ,将 矩阵 化 为 标准 形式 后 得 到 : 


10 0 0 
= 1 0 0 
0 0 0 


将 所 有 的 初等 行列 操作 写成 矩阵 ,我 们 得 到 : 


现在 我 们 考虑 矩阵 : 


A= 











1 
ae 0 
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001 ò 
E* = 
010 4 
000 1 
通过 以 上 和 矩阵 ， 
A 一 E*AcE 
z 39 
001 llo 1 0 
010 4llo o of/—4 —! 0 
lò go Ue dl —42 1 
ae dee 
2 2 0 
_| @ o0 
—2 —1 0 
0 00 





我 们 得 到 的 A 为 矩阵 A 的 广义 逆 矩 阵 。 
我 们 考虑 一 个 含有 nn 个 未 知 数 和 xm 个 线 行 联 立方 程 的 方程 组 ， 
KRA = a 
假设 该 方程 组 是 一 致 的 且 为 从 定 方程 组 ,那么 ， 
x" =A b C1. 16] 
该 方程 组 有 无 数 解 。 如 果 方 程 组 有 唯一 解 ,那么 ,我 们 可 以 通过 方程 1. 16 算出 。 


最 后 ,如 果 该 方程 组 是 超 定 的 ,那么 ,方程 1. 16 无 法 满足 原 方程 组 , 即 方程 组 无 解 。 
因此 ,我 们 可 以 知道 ,如 果 方 程 组 是 一 致 的 ,那么 , AA b= b, 否则 ,AA b+b. 


特征 值 与 特征 向 量 


如 果 A K n 阶 方 阵 ,那么 齐 次 线性 方程 组 
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(A—AI,)x = 0 [1.17] 


只 有 在 纯 量 A 为 某 几 个 特定 数值 时 , 它 有 非 无 效 解 。 通 过 上 面 的 内 容 , 我 们 知 
道 , 当 矩阵 (A 一 和 5) 为 奇异 矩阵 时 ,方程 组 存在 无 效 解 , 即 当 满足 下 列 条 件 时 : 


det(A—AI,) = 0 [1. 18] 


方程 1. 18 称 为 矩阵 A 的 “特征 方程 ”,4 为 矩阵 A 的 特征 值 ,特征 根 或 者 潜伏 根 。 
在 某 一 特征 值 A1 下 满足 方程 1. 17 KE x 称 为 在 特征 值 FR A 的 “ 特 
征 向 量 ”。 

为 简单 起 见 , 我 用 一 个 (2 X 2) 矩阵 的 例子 来 详细 解释 。 对 于 此 例 , 特 征 方 
程 可 写 为 : 





(an A) Caz A) Q12Q21 =0 
A — (ay +422) Atay a22 一 aizazi 一 0 


利用 一 元 二 次 方程 的 相关 公式 来 计算 其 两 个 平方 根 , 则 有 [1 , 





A = Han 十 az + V (an Haz) —4lanan — aran | 
[1. 19] 


Àz: = Ifan 十 az — y (an + az)? — 4(ay a2 — 1242) | 


如 果 根 号 以 下 部 分 非 负 , 那 么 该 平方 根 必 为 实数 。 注 意 , 有 可 能 存在 A HA = 
an Faz (A 的 特征 值 之 和 等 于 A 的 迹 ) 和 XiXhz = aan 一 aizaza (特征 值 的 积 等 
于 矩阵 A 的 行列 式 的 值 ) 的 情况 。 而 且 , 如 果 A 为 奇异 矩阵 , 则 Ao 为 0。 

当 和 矩阵 A 为 对 称 矩 阵 (在 特征 值 和 特征 向 量 的 统计 应 用 中 很 常见 ) 时 ,有 
al = ai， 方程 1. 19 变 为 : 





1 
41 = Lan 十 azz 十 J (an —az) 十 4a’, | 
C1. 20] 





1 
At = 5 Lain + ar 一 J (an — ton)” + 4a’, | 
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由 于 方程 1. 20 根 号 以 下 的 部 分 不 可 能 为 负 , 因 此 ,该 (2X2) 对 称 和 矩阵 的 特征 值 
例如 ,我 们 有 如 下 甜 阵 : 


那么 ,可 以 得 到 : 








a= ;|1 LI wel IP F405" | = 1.5 


on athe — /i— iP ee | = 
= Zit al D F40.5 | = 0.5 


要 找到 特征 值 为 入 = 1. 5 时 的 特征 向 量 , 我 们 需要 解 齐 次 方程 组 ， 
1-L5 (OB) [i 0 
| 人 H ` b 
—0.5 0.5 | [zn 0 
区 


得 到 : 


在 这 里 ,任意 向 量 都 包含 两 个 相同 元 。 同 样 ,对 于 % = 0. 5, 我 们 要 解 特征 方 
程 组 : 


得 到 : 


41 
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在 这 里 ,任意 向 量 都 包含 两 个 互 为 相反 数 的 元 。 所 得 特征 值 下 的 特征 向 量 可 以 
扩展 出 一 个 一 维 子 空间 : 当 指 定 了 特征 向 量 中 的 一 个 元 时 , 另 一 个 元 也 随 之 可 
得 。 我 们 会 进一步 现 , 所 求 的 两 个 特征 向 量 Xi. X2 是 互相 正 交 的 , 即 : 


+ a "4 
Xi * Xe 一 一 Z21Z22 xara = 0 


许多 有 关 (2X 2) 矩阵 的 特征 值 和 特征 向 量 的 性 质 可 以 推广 到 (aX n) 矩阵 
中 ,尤其 是 以 下 几 种 情况 :(1) 一 个 (n Xn) 矩阵 的 特征 方程 det(A 一 XL,) = 0 Æ 
4 的 nn 阶 多 项 式 ,因此 , 它 的 个 特征 值 不 一 定 完全 不 同 引 ;(2) 和 矩阵 A 的 所 有 
特征 值 之 和 等 于 A 的 迹 ;(3) 矩 阵 A 的 所 有 特征 值 之 积 等 于 A 的 行列 式 ; OE 
E A 的 非 零 特征 值 个 数 等 于 A 的 秩 ;(5) 奇 异 矩阵 至 少 有 一 个 特征 值 为 0; (6) 实 
对 称 和 矩阵 的 特征 值 必 为 实数 ;(7) WORE A 的 所 有 特征 值 全 都 不 同 (两 两 均 不 
ED ,那么 特征 值 下 的 特征 向 量 可 扩张 出 一 个 一 维 子 空间 ;如 果 有 A 个 特征 值 全 
相同 ,那么 它们 产生 的 (同一 个 ) 特 征 向量 可 以 扩张 出 一 个 & 维 子 空间 ;(8) 不 同 
特征 值 所 产生 的 特征 向 量 是 两 两 正 交 的 。 

假设 A 为 一 个 (z* 义 轧 实 对 称 矩 阵 , 且 秩 等 于 ~。 让 和 人 = diag, A250 A) 
表示 A 的 所 有 非 零 特征 值 ,x; 表示 特征 值 M 下 的 特征 向 量 , 标 准 化 后 ,我 们 得 到 
lx | =1. AX=Cx, mx] 表示 所 有 的 特征 向 量 ,那么 ， 


A = àx x 十 2X2 十 十 XXX 一 XAX [1.21] 


方程 1. 21 称 为 矩阵 A 的 “ 谱 分 解 ”, 它 是 统计 方法 中 主 成 分 分 析 和 因子 分 析 等 
方法 的 基础 。 
特征 值 及 特征 向 量 可 推广 为 如 下 方法 :假设 A 为 一 个 (n Xn) 实 对 称 矩 阵 ， 
我 们 可 以 将 方程 1. 17 替换 成 : 
(A—AB)x = 0 


其 中 ,B 也 是 一 个 (nXn) KIPER TELE —MEEMIME. WA MEANE 
BR) A 称 为 矩阵 了 下 矩阵 A 的 “广义 特征 值 "。 我 们 发 现 ,广义 特征 值 其 实 是 矩阵 
AB! 的 一 般 特征 值 。 广 义 特征 值 和 特征 向 量 在 多 元 统计 分 析 中 非常 有 用 ,如 多 
元 线性 模型 的 假设 检验 。 
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特征 值 和 特征 向 量 的 另 一 种 推广 是 有 关 长 方形 矩阵 的 特征 值 及 特征 向 量 。 
假设 矩阵 A 为 (nX n) 矩阵 , 且 其 秩 为 -。 那 么 ,A 可 分 解 为 : 


A 0 
(rXr) (Xn) , 
A= B | | C [1.22] 
(mXm) 0 0 (nXn) 


mrXr) (m—-rXn-ry 


其 中 ,(1) 矩阵 B 和 矩阵 C 为 正 交 和 矩阵 ,但 不 是 唯一 的 ; (2) A? FA— SX 
阵 , 它 包含 矩阵 A'A 和 AA’ (它们 包含 的 特征 值 相同 ) 的 所 有 非 零 特 征 值 ;(3) 不 
是 有 所 有 零 矩阵 都 会 用 到 (当然 ,如 果 rv = m = n, 那么 方程 1. 22 可 以 简化 为 方 
程 1. 21 的 谱 分 解 ) 。 

方程 1. 22 称 做 矩阵 A 的 “奇异 值 分 解 ”, 和 矩阵 A 的 对 角 元 为 矩阵 A 的 奇异 
值 ( 因 此 是 矩阵 A'A 和 AA 特征 值 的 平方 根 )。 奇 异 值 分 解 非常 有 用 ,比如 在 提 
高 最 小 二 乘 计算 的 效率 和 精度 上 。 


TRIB EE 


RIA: 
[1. 23] 


x 
称 为 “x 的 二 次 型 ”。 在 本 节 里 ,矩阵 A 从 始 至 终 表示 一 个 实 对 称 和 矩阵 。 如 果 方 
程 1. 23 对 于 所 有 的 x 都 为 非 负 ,那么 ,我 们 说 矩阵 A 为 正定 矩阵 。 一 个 正定 矩 
阵 的 所 有 特征 值 均 为 正 ( 因 此 ,正定 和 矩阵 是 非 奇 异 矩 阵 ) ,一 个 半 正 定 矩 阵 的 所 
有 特征 值 均 为 正 或 者 为 0。 
请 看 以 下 方程 : 


C=B AB 
mXm. 


¢ ) (mXn) (nXn (nXm) 


其 中 ,A 为 正定 矩阵 ,B 为 列 满 秩 矩阵 , m< n, 我 会 证 明 , 和 矩阵 C 同样 是 正定 矩 
阵 。 注 意 , 首 先 矩 阵 C 是 对 称 的 : 


C’ = (B’AB)’ = B'A'B = B'AB = C 
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如 果 y 是 任意 Gm X 1) 非 零 向 量 ,那么 x = By 也 为 非 零 向 量 。 因 为 矩阵 B 的 
BEI mm, BEAT AT SAB 中 选择 mm 个 线性 独立 的 行 组 成 一 个 非 奇异 矩阵 B' 。 屠 
A, x 二 By, 它 包 括 向 量 x 中 所 包含 元 的 子 集 , 且 也 是 非 零 的 ,原因 在 于 y = 
BY x" 天 0。 因 此 , YCy 一 YB'ABy = x’ Ax 必然 为 正 ,所 以 矩阵 C 为 正定 和 矩阵。 
通过 类 似 的 推理 可 以 发 现 ,如 果 rank(B) < m, 那么 矩阵 C 为 半 正定 矩阵 。 如 
果 B 为 列 满 秩 和 矩阵 ,那么 矩阵 B B = BIB YATE RE ME IAE I 明 
显 为 一 个 正定 矩阵 ) ,否则 为 半 正定 氛 隆 。 

正定 矩阵 和 半 正 定 矩阵 ,如 方差 一 协 方差 矩阵 、 相 关 抢 阵 平方 和 和 乘积 抵 
阵 ,在 统计 中 都 起 着 至 关 重要 的 作用 。 


Cholesky 分 解 


每 个 对 称 正定 矩阵 A 都 可 以 被 唯一 地 写 为 A = UU, 其 中 ,U 是 一 个 对 角 
元 素 为 正 的 上 三 角 和 矩阵 。U 称 为 矩阵 A 的 “Cholesky 因子 ”, 或 者 可 以 看 成 是 某 
种 矩阵 的 平方 根 。 

现在 我 们 来 考虑 一 个 (3 X 3) 矩阵 ， 


10 0.5 0.3 
0.5 1.9 5 





A= 
03 0.5 1.0 
同时 用 和 矩阵 U, 
U1 Uz ug 
U= |O ug uz 


0 0 uz 
来 表示 和 撼 阵 A 的 Cholesky AF. ABA, 
ur, Ui U12 Ui U13 
UU = Janu uiz F Uz Ui2 Ui3 十 U22 U23 


2 2 2 
Uiu Ugu 十 Uzu: ut uz + us; 
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1.0 0.5 0.3 
-| 1.0 ea] 


0.3 0.5 1.0 

进而 得 到 : 

uy, =1.0—> u = 1.0 

uzun = ug X 1 = 0. 5 > u = 0.5 

u, 十 z2 = 0. 5? Hib, = 1 — un = /1—0.5* = 0. 8660 

uitu = ug X 1 = 0. 3—> u; = 0.3 

uigu + uzu: = 0. 3 X 0. 5+ uz X 0. 8660 = 0.5 一 

uz = (0. 5—0. 3 X 0. 5)/0. 8660 = 0. 4041 

uis H uz 十 uss = 0. 3? +0. 4141? + uh = 1 一 

uss = /1—0. 3—0. 41417 = 0. 8641 
因此 ， 


10 0.5 0.3 
U= | 0 0.8660 0. oa 
0 0 0. 8641 


这 个 过 程 可 以 引申 到 任意 秩 的 对 称 正定 矩阵 上 .。[3] 
推荐 阅读 


有 关 和 矩阵 及 线性 代数 的 书籍 很 多 ,大 多 数 仅 仅 描述 了 有 关 向 量 空间 的 基本 
属性 , 却 没有 提供 详细 的 图 解 。 

KFS BE aAA] (Healy, 1986), H E LAK (Graybill, 1983), 3 
尔 (Searle, 1982) 以 及 格林 (Green) 和 卡 罗 尔 (Carroll) (1976) 的 研究 , 均 主要 针 
对 统计 应 用 。 后 几 本 的 几何 描述 很 详细 。 

戴 维 斯 (Davis，1973) 的 著作 对 矩阵 代数 的 描述 清晰 且 简 单 ,包括 一 些 向 量 
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几何 内 容 , 但 较为 有 限 , 仅 局 限于 二 维 空间 。 

南 布 狄 瑞 (Namboodiri,，1984) 的 著作 有 关于 矩阵 代数 的 解释 ,结构 紧凑 ,但 
是 不 包括 向 量 几何 。 

有 关 统 计 计 算 的 书籍 ,有 肯尼迪 (Kennedy) 和 金 特 尔 (Gentle) (1980) 及 葛 
纳 汉 (Monahan) (2001) 等 人 的 著作 ,主要 描述 了 和 矩阵 和 线性 代数 在 数字 计算 机 
中 的 应 用 。 


有 有 


微 积分 主要 用 于 处 理 两 种 问题 :寻找 曲线 的 切线 斜率 (微分 ) 和 计算 曲线 下 
方 的 面积 (积分 )。 早 在 17 世纪 ,英国 物理 学 家 、 数 学 家 艾 萨 克 。 ELE (Sir 
Isaac Newton) 和 德国 数学 家 、 哲 学 家 戈 特 弗 里 德 。 威廉 。 凡 ，。 莱 布 尼 芯 Gott- 
friend Wilhelm von Leibniz) 就 各 自 独立 地 证 明了 这 两 种 问题 的 联系 ,进一步 巩 
固 并 发 展 了 古典 时 代 的 数学 。 因 此 ,牛顿 和 莱 布 尼 茨 是 公认 的 微 积分 创始 
A OUST 19 世纪 ,伟大 的 法 国 数学 家 奥古斯丁 。 路易 斯 ， 柯 西 (Augustin 
Louis Cauchy) 与 其 他 学 者 一 起 ,引入 了 极限 的 概念 ,从 而 为 微 积分 建立 了 一 个 
在 逻辑 上 更 为 严格 的 基础 。 

在 本 章 中 ,我 们 首先 简单 回顾 一 些 基础 数学 (如 数字 、 线 性 /平面 方程 .多 项 
式 函数 .对 数 、 指 数 及 基本 的 三 角 函 数 ), 然 后 ,我 按 如 下 次 序 简要 地 介绍 微 积 
分 :方程 的 极限 ;方程 的 求 导 ;利用 求 导 解决 最 优化 问题 ;多 变量 的 偏 导 、 条 件 最 
优化 和 矩阵 的 微 积分 ;泰勒 展 式 和 半 近 式 ; 积 分 学 的 重要 思想 。 

虽然 我 的 叙述 远 不 够 严格 .透彻 ,但 是 读者 仍 可 以 从 中 获得 许多 对 微 积分 
基本 问题 的 直觉 认识 。 





回顾 


数字 


对 不 同类 别 数字 的 定义 取决 于 所 要 研究 的 数学 问题 的 深度 ,对 于 社会 科 
学 ,如 下 基本 定义 已 经 可 以 基本 满足 我 们 的 研究 目的 了 : 
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第 一 ,自然 数 包括 0 及 所 有 正 整数 .[15] 
第 二 ,整数 包括 所 有 负 整 数 、 正 整数 和 0。 - 
第 三 ,整数 和 分 数 统称 为 有 理 数 ,任何 一 个 有 理 数 都 可 以 写成 分 数字 (7 和 


m 是 整数 , 且 m 关 0) 的 形式 。 如 一 去 和 -全 


第 四 ,实数 包括 所 有 的 有 理 数 和 无 理 数 ,例如 , V2 =~ 1. 41421, 数学 常数 
n = 3. 14159 R e ~ 2. 71828, 这 些 数 都 不 能 写成 两 个 整数 的 比例 。 所 有 实数 可 
以 投影 到 一 条 连续 的 直线 上 ,从 一 ce 到 十 ce。 

第 五 ,复数 可 以 用 a+b 表示 ,其 中 ,a 和 0 是 实数 ,i 是 虚数 , i= V 一 1, 在 
直角 坐标 系 中 ,复数 可 以 想象 成 复 平面 上 的 点 一 一 横 轴 即 实 轴 对 应 于 实数 部 分 
a, 纵 轴 即 虚 轴 对 应 于 虚数 部 分 的 系数 bis 1 b = 0 时 ,复数 即 实数 。 


线 和 平面 


直线 可 以 用 方程 表示 : 
yy 一 & 十 pr 
其 中 ,a Alb 是 常数 , 且 a 是 y 轴 截 距 ( x 二 0 时 的 y 值 ),b 是 斜率 (z 增 加 1 时 y 
的 变化 ) 。 图 2. 1 表示 在 二 维 坐 标 下 以 zx Aly 为 轴 的 直线 ,对 于 每 一 种 情况 , 直 
线 都 是 可 以 向 左右 无 限 延 伸 的 。 如 果 斜 率 是正 的 (5 之 0), 直线 从 西南 往 东 北 延 
伸 ; 如 果 和 斜率 是 负 的 (< 0), 直线 从 西北 往 东 南 延伸 ;如 果 2 = 0, 直线 是 水 平 的 。 


(a) 0 之 0 (b) b<0 (c) b=0 





YE: (a) b> 0; (b)b <0; (c)0 一 0。 


图 2.1 直线 y== a 十 bx 的 图 像 
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同样 ,我 们 有 线性 方程 : 
tt a 二 bx Hoza: 


它 代 表 三 维 空间 的 一 个 以 1 xe 和 y 为 轴 的 
平面 ,如 图 2. 2 FR. zn x Al y 轴 两 两 垂直 ， 
我 们 可 以 把 zx; 轴 的 方向 想象 成 垂直 于 纸 面向 
内 , 且 平 面 在 各 个 方向 无 限 延 伸 。 据 图 , 截 距 a 
表示 在 x 和 z 都 为 0 时 的 y 值 ; 表示 固定 
了 x 值 后 ,平面 在 zi 方向 上 的 斜率 ;2: 表示 固 
E zi 值 后 ,平面 在 zx; 方向 上 的 斜率 。 

直线 方程 还 可 以 表示 为 其 他 形式 : 


y=atbz,+b,2, 





注 :这 里 斜率 b, b 都 是 正 值 。 
图 2.2 平面 方程 y= a 十 bixi 十 b,x; 





cx +dy =e 
将 其 转换 为 截 距 式 为 : 
e c 
Joa g 
同样 ,方程 
Gti + 2X2 +dy —= ie 
可 以 表示 平面 
e Cl C2 
a a 
多 项 式 
多 项 式 具 有 以 下 形式 : 


yy 一 ao 十 aiz 十 azzZ2z 十 … 十 Coz2 


其 中 ,ao，a，a ，… ap 是 常数 , 除 ap 外 ,其 他 系数 可 为 0。 最 大 的 指数 p 为 多 
项 式 的 阶 。 如 图 2. 3 所 示 ,一 阶 多 项 式 即 一 条 直线 : 


y = ap tax 
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二 阶 多 项 式 是 二 次 方程 : 
y =a tartar 
三 阶 多 项 式 是 三 次 方程 
y=atartasr tax 
一 个 p 阶 的 多 项 式 有 zp 一 1 个 弯 。 例 如 ,二 阶 多 项 式 有 一 个 弯 , 三 阶 多 项 式 
有 两 个 弯 ,等 等 。 


(a) y 一 ao +a x (b) > 一 ao 十 ciz 十 az x’ (c) y 一 ao 十 ai 并 十 az r +a; 2° 
ki Bd F. 


x x x 


图 2.3 “典型 "的 一 阶 (线性 ) 二 阶 ( 二 次 型 ) 三 阶 (三 次 方 ) 多 项 式 


指数 和 对 数 


对 数 方程 
log, x = y 


读 作 “ 以 5 为 底 xz 为 真 数 的 对 数 是 y”, 其 等 价 于 


t=p 
HH,b>0Hb1., 
log 10 = 1 AYI = 10 
logic 100 = 2 因为 10? 一 100 
login 1 = 0 因为 10° = 
logy 0. 1 =— 1 AIA 10 = 0.1 


同样 ， 
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log, 2=1 AW 2! =2 
log 4 = 2 AW2=4 
log: 1 = 0 AH 2° = 1 

E yo 1 
log: | 2 因为 2 1 


实际 上 ,不 论 底 为 何 数 ,只 要 真 数 为 1, 其 对 数 就 为 0, 因 为 8 二 1(5 关 0)。 在 对 数 函 
数 中 ,z 的 定义 域 为 x > 0。 数学 中 有 一 些 常用 的 底 , 如 数学 常数 es 2. 71828, 其 
中 ,以 e 为 底 的 对 数 都 称 为 “自然 对 数 ”。[16] 

典型 的 对 数 方程 不 管 其 底 如 何 ,都 具有 类 >=log, z 
似 的 形状 ,如 图 2.4 所 示 。 有 时 为 方便 计算 ,我 
们 常常 需要 将 对 数 函 数 的 底 换 为 男 一 个 常数 或 
字符 ,这 时 ,我 们 得 到 : 





log, z = log, b X log, x 
该 公式 为 换 底 公 式 。 例 如 ， 图 2.4 MEM y= low x 


logo 1000 = 3 = logio2 X log: 1000 = 0. 301030 X 9. 965784 
对 数 继承 了 指数 的 一 些 特 性 ,如 bbe = ba 9 因此 ， 


log(zizz) = logzi + logzz 
“~ 


x, 


同样 ， = 一 pb 因此 有 : 


iog (三 ) = logzı — log x. 


b= = (b), 那么 ， 
log(x*) = alog 工 
为 了 简化 繁 元 的 计算 ,我 们 曾 将 乘法 转化 为 加 法 、 除 法 转化 为 减法 、 指 数 转化 为 
乘法 。 虽 然 现 在 已 经 不 需要 这 么 做 了 ,但 对 数 仍然 在 数学 及 统计 学 中 扮演 着 不 
可 或 缺 的 角色 。 
指数 方程 具有 这 样 的 形式 : 
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y=e gee 
150 

其 中 ,a 是 常数 。 常 用 的 指数 有 y= expl) = 
109 e, 如 图 2. 5 所 示 。 对 数 函 数 和 指数 函数 互 为 
50 FLAX: log.(a*) = x, a®* =x, 


三 角 函 数 


一 1 0 1 2 3 4 52 

oe eee 图 2. 6 为 一 个 单位 圆 一 一 一 个 圆心 在 原 
点 ,半径 为 1 的 圆 。 角 z 在 圆 内 生成 了 一 个 直角 三 角形 ,同时 ,该 夹 角 是 以 水 平 
轴 为 起 始 轴 , 按 逆 时 针 方向 旋转 测量 得 出 的 。 

角 工 的 余弦 即 邻 边 / 斜 边 (O4/OB) id 
为 cosz, 长 度 等 于 OA( 因 为 0B = 1); fi x 
的 正弦 即 对 边 / 斜 边 (AB/OB) , 记 为 sinz, 长 
度 等 于 AB; 角 x 的 正切 即 对 边 / 邻 边 (AB/ C 
OA) , 记 为 tanz = sinz/cosz。 

如 图 2. 7 所 示 , 正弦 余弦 .正切 函数 角 
的 取 值 范围 为 一 360 到 360 ,其 中 负 值 表示 
顺 时 针 方 向 旋转 得 到 的 角 。 当 夹 角 趋 近 于 2 6 单位 圆 \ 夹 角 及 其 正弦 和 余弦 
士 90 或 士 270 时 ,正切 函数 值 相应 地 趋 近 于 士 ce。 此 外 , sing = cos(x— 90), 














1 
1 
1 
1 
1 
| 
| 
| 
1 


图 2.7 角度 在 x 王 一 360" fl x = 360 之 间 的 正弦 .余弦 和 正切 函数 
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有 时 ,用 弧度 来 度量 角 会 更 加 方便 ,2x 弧度 等 价 于 360 角度 。 如 图 2. 6, 由 
于 单位 圆 的 周 长 为 2r, 因 此 我 们 可 以 用 夹 角 两 边 所 夹 的 弧 长 来 代表 弧度 ,如 角 
x WME A BC. 


极限 


微 积 分 常用 来 处 理 具 有 y= f(x) 形式 的 函数 ,我 们 所 考虑 的 定义 域 ( 自 变 
量 的 取 值 ) 和 值 域 ( 因 变量 的 取 值 ) 都 是 实数 。 极 限 用 于 考虑 函数 在 其 自 变量 x 
趋 近 但 不 等 于 某 个 数值 时 的 行为 。 这 是 一 个 很 重要 的 思想 ,尤其 在 函数 没有 对 
自 变量 z 的 某 些 数值 给 出 定义 或 者 函数 在 某 些 数值 下 没有 意义 的 情况 下 。 


极限 的 “s 一 0 定义 


函数 y = f(x) 在 zx = x ( 即 一 个 特定 的 z 值 ) 处 有 极限 工 。 对 于 任意 正 数 
se, 无 论 它 多 小 ,总 是 存在 一 个 正 数 $, 只 要 满足 z 与 ze 的 距离 小 于 6, 即 只 要 x 
位 于 ze 左右 两 边 足够 小 的 20 值 域 中 , fo) L 的 距离 即 小 于 es。 用 符号 表 
示 为 : 
| f(z) -Ll<e (0 二 |z 一 站 二 9) 


y=f (2) 
和 Dek oa / 
1 i 


To 一 8 ZoZ0 十 8 T 


Xo AY CESK 
注 :zx。 上 方 对 应 的 曲线 的 缺口 表示 当 x = x 时 函数 值 无 法 定义 。 
图 2.8 lim f(x) = L: 函数 f(x) 的 极限 





图 2. 8 形象 地 描述 了 这 一 定义 。 注 意 ,其 中 f(xo) 不 需要 等 于 LL。 实际 上 ， 
极限 函数 当 f(z) 在 z= zo 不 存在 的 时 候 最 有 用 。 Æ LESE r= r HH 


53 


54 


| 社会 科学 中 的 数理 基础 及 应 用 


极限 ,意味 着 当 z 从 ze 左右 两 边 趋 近 z 时 , f(z) 趋 近 于 LL。 用 公式 表示 为 : 
lim f(z)=L 


BEE“ F(X) FE x ÉF xo 时 的 极限 为 L”。 


一 个 例子 :如 何 找 极限 





让 我 们 来 找 出 函数 y = f(z) = T] 在 zo = 1 时 的 极限 。 我 们 发 现 ， 


f(D =i = 全 是 没有 意义 的 (分 母 为 0)。 尽 管 如 此 ,只 要 不 等 于 1 ,无论 
y 它 多 么 接近 1, 我 们 都 可 以 将 等 式 上 下 除 以 





x—l; 


=) toz 


完 一 1] x—l 


= =4F1 


因为 ro +1 =1+1= 2, 所 以 








2 
ti i = leek SI 2 
~~! xr—l Pes 





1 22 

et eT 
图 2.9 lim = 2(x#1) 图 2. 9 展示 了 这 个 极限 。 
极限 运算 规则 


假设 f(x) 和 g(z) 是 自 变量 x 的 两 个 函数 , 且 在 eco 时 都 有 极限 : 
lim f(a) =a 
lim g(x) =b 
那么 , f(x) 和 g(x) 的 极限 的 算术 运算 如 下 : 
lim[ f(x) 十 g(x)] 二 a 二 6 
lim[ f(x) 一 &(z)] 王 4 一 0 


limL f(x) g(x) J = ab 
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lim[ fx)/g Cr)] =a/b 天 0) 
同样 ,假设 < 和 是 常数 , 且 lim f(x) = a, 那么 ， 
lime =e 
lim[cf(2)] = aa 
inl C707) -< 
因此 ， 


lim B= o 
rer 


PAB AE 


现在 考虑 函数 y = f(x) 在 xz 的 两 个 值 下 的 情况 : 
T=X, Y= f) 
X = Xz, Y2 = flr) 
差 商 是 指 从 点 (zi Jı ) 到 点 (zz ， y2 ) 时 ,y 值 的 变化 除 以 xz 值 的 变化 , 即 : 


WWW. Ay _ flr) — flr) 


这 和 一 5 | Ar 2 BY 





其 中 ,人 读 作 “Delta”, 是 “变化 ”的 简写 。 如 图 2. 10 所 示 , 差 商 是 连接 点 (x1，wi) 
和 点 (zz， y WRR. 





1 
1 
[i 
1 
1 
[j 
1 
1 
1 
1 
1 
1 
1 
1 
Xs 


Tı Ax 
图 2.10 差 商 Ay/Ax EE, ys) A(x, y ARHHARHAS 


ty È 
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FODE x = x 时 的 导数 是 差 商 人 在 zs 接近 zi 时 的 极限 ( 即 Ar->0): 








dy CA 


如 图 2. 11 所 示 ,导数 是 SOE r = r 时 的 切线 。 





注 : 随 着 zs 逐渐 趋 近 于 zi , 制 线 越 来 越 趋 近 于 切线 。 
图 2. 11 导数 是 /(x, ) 的 切线 斜率 
我 们 还 可 以 用 下 面 的 符号 表示 导数 : 


表达 式 f(z) 强调 了 导数 是 x 本 身 的 一 个 函数 。 对 于 dz All dy ,可 以 将 其 想象 
成 无 限 小 但 是 不 等 于 0 的 数值 ,在 很 多 情况 下 的 求 导 可 以 把 它们 当做 数字 来 处 
理 。 求 函数 导数 的 过 程 叫做 “微分 ”。 


导数 一 一 差 商 的 极限 


给 定 函 数 y = f(x) = t, RER r Hf a. 
运用 导数 是 差 商 的 极限 的 定义 : 





=f 2 2 
futa lim feta f(x) Z lim er Aa x 
Zp 1 十 2zAz 十 Az — 2? _ 
= Ar aed 
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= lim(2x + Ar) = lim 2z + lim Ar 
Ar+0 Ar) Ar—>0 
= 2r +0 = 2x 


由 于 Ar 虽然 接近 于 0, 但 是 永远 不 等 于 0, 因 此 除法 是 合适 的 。 例 如 ,曲线 y= 
fxz) 一 妇 在 z=3 时 的 切线 是 广 (z) 一 2z 一 2X3 一 6。 





里 函数 的 导数 





Mita,» y = f(x) = ar" 的 导数 为 : 


例如 , y = 3z 的 导数 是 : 


dy = 6 X 32°! = 182° 
dx 


负 宕 函数 和 分 数 寡 函 数 的 导数 是 类 似 的 ,例如 , y = gh = 十 z? PE: 





dy 1 3] 3 Po aa 3 
dp Oe Og 7g 
y=Vr=2x" 的 导数 是 : 
d = tl = 一 人 + = ee 
dx 2J/z 
导数 的 运算 规则 


假设 一 个 函数 是 另外 两 个 函数 的 和 : 
h(x) = fla) + g@) 
导数 的 加 法 规则 与 极限 函数 的 加 法 规则 一 样 ,为 (zx) = 广 (z) 十 gz)。 例 如 ， 
y= 22° +3xr+4 


d 
= 4r +3 +0 = 4r +3 
dx 
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注意 ,常数 的 导数 (如 上 例 中 常数 4 的 导数 ) 为 0, 因 为 常数 可 以 表示 为 : 
y= f(z) = 4 = 42° 
该 结果 的 几何 意义 是 ,一 个 常数 可 以 用 {z，y} 平 面 的 一 条 水 平 直 线 表示 ,而 这 条 


直线 的 斜率 为 0。 
对 于 多 项 式 函 数 ,导数 的 加 法 规则 同样 适用 : 


d 
ax" = nax”! 


ax 
导数 的 乘法 和 除法 规则 比较 复杂 。 导 数 的 乘法 规则 为 : 
h(x) = f(a) g(x) 
h(x) = flag’ a) + f’ @eG@) 
导数 的 除法 规则 为 : 
h(x) = f(x)/g(x) 


— g(x) f (x) — g'(x) f(z) 
Lg(x) } 





h'(x) 


例如 ,y = C H1O 一 3z) 的 导数 为 : 





dy = (x? +1) (62? — 3) + 2x (2x? — 3x) 
dx 
又 如 ,y = FE AR 的 导数 为 : 
dy 了 一 3z 十 5 一 (2z 一 3)z _ — z’ +5 
dx (2? —3x+5)? (x? — 3x + 5)? 


导数 的 链 式 规则 为 ,假设 > 是 z 的 间接 函数 ,y = f(z), z= g(a): 
y= fl g(x) ] = h(a) 


那么 ,> 关于 z 的 导数 为 : 
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dy dy dz 
ha) = 22x 
Aa dx dz dx 





看 上 去 分 子 和 分 母 中 的 导数 dz 可 以 消去 .L171 


MURER y= GHO 中 y 关 于 z 的 导数 ,我们 可 以 展开 香 了 
数 ( 即 括号 里 的 表达 式 乘 以 它 自身 5 次 ) ,但 是 这 样 会 使 运算 极其 复杂 。 如 果 我 
们 运用 链 式 法 则 ,会 使 运算 简单 得 多 。 首 先 ,引入 一 个 新 的 变量 =, 代 表 括 号 里 
的 表达 式 ， 
z= g(x) = z +3x+6 





那么 ， 
y= f(z)= 
然后 用 y X z, = 对 z 分 别 求 导数 得 到 : 
dy = 52" 
dz 
dz _ 
ie 2x +3 
运用 链 式 法 则 得 到 : 
dy _ dy dz i 
om a X Ta = §2° (22+3) 


最 后 ,用 工 蔡 代 z, 得 到 : 


dy = 5(2? + 324+ 6)'(2x+3) 
dx 


此 例 是 典型 的 链 式 法 则 运用 :引入 一 个 “人 为 ”的 变量 来 简化 表达 式 的 结构 。 
指数 函数 和 对 数 函数 的 导数 


在 应 用 统计 中 ,我 们 经 常会 碰 到 指数 函数 和 对 数 函 数 ,因此 ,知道 如 何 求 这 
些 函数 的 导数 是 很 重要 的 。 
对 数 函 数 y = log. (x) 的 导数 是 : 
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dlog.(x) 1 4 
dx > 


其 中 ,log. 是 自然 对 数 , 即 以 e ~ 2. 71828 为 底 的 对 数 。 
事实 上 ,简单 的 导数 形式 是 自然 对 数 称 为 “自然 ?的 原因 之 一 。 
指数 函数 y = e 的 导数 为 : 


de” _ 
dx 


对 于 任意 常数 a 的 指数 函数 y = a", 其 导数 为 : 


da” 
dx 


e 





= a” log, a 


三 角 函 数 的 导数 


基本 三 角 函 数 的 导数 如 下 ,其 中 ,z 是 以 弧度 为 单位 的 : 


dcosx ___ dir 
dx 
dsin _ eae 
dx 
dtanzx_ 1 Ed 3x : 
=e = olr (z+ 2 ’ + 2 , 即 cos x Æ 0) 


二 阶 或 高 阶 导 数 


因为 导数 是 它 本 身 的 函数 ,所 以 可 以 被 再 次 求 导 。 函 数 y 二 f(x) 的 二 阶 导 
BA: 


j dy df'(z) 
(x) = — = 一 -一 
T AR dx’ dx 


同样 , y = f(x) 的 三 阶 导数 是 二 阶 导 数 的 导数 : 


_ By df") 
dx’ dx 





f”) 
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高 阶 导 数 以 此 类 推 。 
例如 ,函数 y = f(x) = 52+ +32°4+6 的 各 阶 导 数 为 : 
f(x) = 2023 十 6z 
ft) = 60x? 十 6 
f” (æ) = 120x 
f” Ge = 120 
Fw(Cz) =o 


该 函数 5 次 以 上 的 导数 都 为 0。 


最 优化 


无 论 是 在 统计 学 还 是 其 他 方面 ,导数 的 一 个 重要 用 途 就 是 求 最 大 化 和 最 小 
化 问题 , 换 句 话说 , 即 求 函数 的 最 大 值 和 最 小 值 ( 例 如 ,最 大 似 然 法 估计 、 最 小 二 
乘法 估计 )。 这 些 问题 统一 被 称 为 “最 优化 ”。 

如 图 2. 12 所 示 ,如 果 函 数 处 于 相对 (局 部 ) 最 大 值 或 最 小 值 ( 即 该 数值 大 于 
或 者 小 于 周围 的 数值 ) ,或 者 处 于 绝对 (全 局 ) 最 大 值 或 最 小 值 ( 即 该 值 至 少 跟 其 
他 数值 一 样 大 或 者 一 样 小 ) ,处 于 该 点 的 切线 是 水 平 的 ,所 以 函数 在 该 点 的 导数 
为 0。 


f (7) 


相对 最 大 值 


绝对 最 小 值 绝对 最 小 值 





图 2.12 函数 的 导数 为 0 的 点 是 函数 f(x) 的 最 大 值 或 最 小 值 
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但 是 ,导数 为 0 的 点 并 不 一 定 是 函数 的 最 大 

值 或 者 最 小 值 。 如 图 2. 13 所 示 ,拐点 (函数 弯曲 

方向 发 生变 化 的 点 ) 的 导数 同样 为 0。 导数 为 0 
的 点 统称 为 " 驻 点 ”。 

为 了 区 别 导数 为 0 的 3 种 情况 一 一 最 小 值 . 最 

is， 大 值 . 损 点 ,我 们 可 以 借助 一 阶 导 数 (如 图 2 14)。 
Sl) AB 原始 函数 、 一 阶 导 数 、 二 阶 导数 的 关系 如 图 
2. 15 所 示 : f(z) 的 一 阶 导数 在 两 个 最 小 值 和 一 个 (相对 ) 最 大 值 处 为 0 ( 2 =0); 


L(x) 








f(x) 


最 小 值 





T x 
注 :在 最 小 值 处 ,一 阶 倒数 了 (zx) 从 负 值 由 0 ZE OTE CEL » BO — Bi TREE, LT SPB”) 
是 正 的 。 正 如 一 阶 导数 标示 原来 函数 的 变化 一 样 ,二 阶 导数 可 以 标示 出 一 阶 导数 的 变化 。 在 最 大 值 
处 ,一 阶 倒数 f(z) 从 正 值 由 0 变 成 负 值 , 即 一 阶 导数 是 递减 的 ,因而 二 阶 导数 广 (z) 是 负 的 。 在 拐点 
处 ,因而 二 阶 导数 广 (z) =0. 
图 2.14 若 函 数 /(x) 在 最 低 点 , 随 着 x 变 大 ,其 一 阶 导 数 变 大 ; 若 函 数 f(x) 在 最 高 点 ， 
随 着 x 变 大 ,其 一 阶 导数 变 小 


y=f (2) dy/dx 






图 2.15 函数 的 一 阶 导数 和 二 阶 导数 
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二 阶 导数 d y/dx? 在 两 个 最 小 值 处 为 正 值 ,而 在 最 大 值 处 为 负 值 。 
最 优化 的 例子 
求 下 面 这 个 函数 的 极 值 ( 最 小 值 或 最 大 值 ) : 
f(x) = 22° = 92? +12e+56 


该 函数 如 图 2. 16 所 示 ( 顺 便 提 一 下 ,确定 局 部 驻 点 和 确定 它们 是 最 小 值 还 是 最 
KIE ,对 于 函数 作 图 很 有 用 )。 





图 2.16 RAX f(x) = 2x 一 9x 十 12x 十 6 的 极 值 


函数 的 一 阶 导 数 、 二 阶 导数 为 : 
f(x) = G2" — 18x + 12 
f”) = 12x? — 18 
令 一 阶 导数 等 于 0, 然后 求 相应 的 z 值得 : 
62? —18x+12=0 
>r —3x+2=0 
一 (z 一 2)(z 一 1) =0 
了 (x) = 0 的 两 个 根 为 一 1 和 xz 一 2。 
UF « = 2, 


f(2) =2X2?—-9xX2?+12K2+6=10 
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f'(2)=6X2—18X2+12=0vV 
6 
因为 六 (2) 为 正 值 ,所 以 点 (2, 10) 代 表 了 一 个 (相对 ) 最 小 值 。 
对 于 工 = 王 1， 
GD 一 2X1 一 9X1 十 12X1 二 6 一 11 
f'Q) =6X ?—18K14+12=0V 
f°) =12xX 1 —18 =— 6 


因为 fC) 为 负 值 ,所 以 点 (1, 11) 代 表 了 一 个 (相对 ) 最 大 值 。 


多 变量 和 和 矩阵 的 微分 学 


多 变量 的 微分 学 在 统计 学 中 有 着 广泛 的 应 用 。 多 变量 的 微分 学 的 关键 思 
想 非常 直接 , 即 它 是 单一 自 变 量 微分 学 的 扩展 ,然而 该 话题 在 微 积 分 人 门 介绍 


中 经 常 被 忽略 。 


偏 导数 


对 于 一 个 具有 多 个 自 变量 的 函数 y = Ar， os ts Lr), 对 于 xz; 的 偏 导 
数 即 假定 其 他 r 为 常数 时 ,f(z1，zxz，…，x,) 的 导数 。 为 了 将 它 和 常用 导数 


dy/dx 相 区 别 ,我 们 常用 3 替代 d 来 表示 偏 导数 :9y/azi。 
例如 ,已 知 函 数 


y= fla, a) =x + 3zi +r +6 
该 函数 对 于 Tı 和 x2 的 偏 导数 为 : 


dy = 2 _ 2 
— = 24, +3x, +0+0 = 2x2, +32, 


Ox) 


dy 
9X2 





= 04+ 6x2. +325 +0 = 6x11? + 3x3 
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求 对 于 c: 的 偏 导数 的 “技巧 "在 于 把 其 他 z 当做 常数 。 所 以 , 当 求 > 对 于 xi 的 
偏 导数 时 ,x; 和 zz 等 均 可 被 当做 常数 。 

偏 导数 FCz ，z，…，z)Vazi 给 出 了 函数 f(a, Xz，…, £a) FE x Fr UA 
上 的 切 超 平面 .518] 例 如 ,函数 f(z, 2) = x? tana, +23 +10 E a =1 和 xz 一 
2 时 的 切面 如 图 2. 17 所 示 。 





图 2.17 BA S, 2) 一 习 十 xz 十 刀 十 10 在 x 王 1 和 > 一 2 时 的 切面 


在 局 部 /全 局 最 小 值 或 者 最 大 值 中 ,切面 在 各 个 方向 上 的 斜率 都 为 0。 因 
此 ,要 求 一 个 多 变量 函数 的 最 小 值 或 最 大 值 ,我 们 就 必须 分 别 对 每 个 变量 求 偏 
导 , 使 之 分 别 为 0, 然 后 解 方程 组 。 

假设 我 们 想 寻找 xz 和 x; 的 值 ,使 得 函数 f(r, zz) = ri Harir: +23 +10 
最 小 。 首 先 我 们 分 别 对 zl 和 zz 求 导 : 





9 

es 2x; + 2X2 
OX, 

9 

2 = xı + 2x2 
O22 


当 偏 导数 等 于 0 时 ,我 们 可 以 得 到 唯一 解 : zk = 0, zo = 0。 在 这 个 例子 中 ,答案 
相当 简单 ,因为 偏 导数 是 zx: re 的 线性 函数 。 当 函数 最 小 时 ,其 值 y = 0° 十 0 X 
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0+0 +10 = 10, 
如 图 2.17 所 示 , 在 “= 1 和 x2 =2 以 上 的 切面 斜率 为 : 


9y 








一 2(1) 十 2 一 4 
ax) 
3 yR =i 
IX2 

拉 格 朗 日 乘 数 和 受 约束 的 最 优化 


拉 格 朗 日 乘 数 使 我 们 能 在 条 件 g(x1，zs，…， £a) = 0 下 最 优化 函数 y = 
fz, ，…，z)。 这 种 方法 实际 上 是 在 偏 导数 中 加 入 了 限制 。 

举 个 简单 的 例子 :将 函数 y = far, zz) = zi 十 Zz 最 小 化 是 要 受 条 件 zi 十 
Zz = 1 制约 的 (假如 没有 该 约束 条 件 ,显然 zi = zz = 二 0 时 函数 最 小 )。 解 决 受 约 
束 的 最 小 化 问题 的 方法 如 下 : 

第 一 ,将 约束 条 件 移 项 成 标准 形式 g(x» 229 tty Tr) = 0, fm +2,—-1=0, 

第 二 ,构造 一 个 具有 如 下 标准 形式 的 新 方程 [19] : 

太一 
新 的 自 变 量 4 读 作 “ 拉 格 朗 日 乘 数 ”, 在 这 个 例子 中 ， 

h(x1, xs A) =a t+a,—ACa ta — 1) 
第 三 ,寻找 最 优化 函数 h(x, X25 ts Las AV iy L23 tts Tay ATA, MVEA 


(x) » L295 **%9 Ins 4) 分 别 对 zi 2 和 ”ny 4 求 偏 导 , 把 这 个 n+1 个 偏 导 数 都 
设 为 0, 然 后 解 方程 组 求 得 Ziy Vey y Las Ao 在 此 例 中 ， 


Jha, » T23 A) 


Ix, 





= 27) A 


Jh(x » X25 A) 
Ix? = 





222 A 


dh(2) > X29 AX — x | 1 
DA = 1 X27 
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TERE A 偏 导 为 0 所 得 到 的 等 式 即 约束 条 件 zx 十 zz 一 1 = 二 0。 因此 ,所 有 满 
足 偏 导 为 0 的 解 必须 首先 满足 约束 条 件 。 所 以 在 本 例 中 ,其 存在 唯一 解 : 
wi =m SO A=) 
拉 格 朗 日 乘 数 可 以 解决 多 个 约束 条 件 的 问题 ,只 要 我 们 给 每 个 约束 条 件 引 
人 一 个 拉 格 朗 日 乘 数 即 可 。 


和 矩阵 的 微分 


对 于 自 变量 为 Lis X29 ***s Xn 的 函数 y = f(£i, L2, s Ln), 我 们 可 以 将 
其 简化 为 y= f(x) 。 其 中 ,向 量 x 二 Dan, x2，…, el 。y 关 于 x 的 向 量 偏 导 
数 (或 者 梯度 ) 是 指 y 对 于 每 一 个 列 向 量 元 的 偏 导 数 。 








WR y 是 x 的 线性 方程 ， 
y= a Kat Harz Fo Fant, 
那么 , ay/ar = a;, 9y/9x = a, 例如 ， 
Tı 


y = 2x4, +32, — 523 = [15 Bs —5] T2 


向 量 的 偏 导数 为 : 


67 


| 社会 科学 中 的 数理 基础 及 应 用 


如 果 y 是 x 的 二 次 形式 , 则 有 : 


ya 
Flt aE A 是 一 个 对 称 和 矩阵 。 把 矩阵 乘积 展开 后 ,得 到 : 
y = andi Hazas, H + amx, 十 2a12x1xz 十 
Haitit T e F iri, Bate 
因此 ， 


ax = aan taat Pitayta 





其 中 ,a 代表 A 的 第 i 行 。 把 这 些 偏 导 数 写 成 向 量 形式 , 即 9y/9x = 2Ax。 线性 函数 
和 二 次 函数 的 向 量 偏 导数 与 单 变量 函数 的 纯 量 偏 导数 是 一 样 的 : dar)/dx = a, 
dlar’ )/dr = 2ax 


例如 ,对 于 


2 3 Tı 
a 
3 1 2 


= 2x7 + 32,2. +3222, +25 
= 27, + 62,22 十 好 
其 对 zx 和 x; 的 偏 导数 为 : 


23. = 4x, + 6x2 
AL 


aS 62, + 2x2 


IX 


那么 ,向 量 的 偏 导 数 为 : 


dy sy | H 
ax 62, +222 3 Wi 


y= f 的 二 阶 偏 导数 一 一 海 森 矩 阵 的 定义 如 下 : 
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| a pi a F eee a y ] 
Ix; IX, 9X2 IX, IX, 
9 a’ B4 a y ... a y 
IY _ |ax,dx, az arzaT 
axax’ 
a’ y a’ B4 ... a’ B4 
[ILI ILAT are 








对 于 对 称 矩 阵 A ,22:(x'Ax)/axax' = 2A, 

为 了 使 多 变量 函数 y = f(x) 最 小 ,我 们 可 以 将 向 量 偏 导 数 设 为 0, 即 
9y/9x = 0, 然后 解 相应 的 关于 x 的 方程 组 ,得 到 解 x** 。 如 果 海 森 矩 阵 在 x = x* 
时 是 正定 的 ,那么 该 解 代表 函数 的 一 个 (局 部 ) 最 小 值 ; 如 果 海 森 和 矩阵 是 负 定 的 ， 
那么 该 解 代表 函数 的 一 个 最 大 值 .[20 这 与 单 变 量 函 数 的 导数 相同 , 即 二 阶 导数 
d’ y/dz’ 为 最 小 值 时 是 正 的 ,为 最 大 值 时 是 负 的 。 

如 之 前 的 函数 ， 





y= fla, xi) 一 也 十 zz 十 好 十 10 


在 zi = 2. = 0.5 处 有 一 个 驻 点 ( 即 在 该 点 上 ,其 偏 导 数 为 0) ,那么 ,函数 的 二 阶 
偏 导数 为 : 
ay ay 


= = J 
92, 9X2 gx29x1 





Py a 
dy Iy 


2 a 
Oz} IT; 








因此 ,在 zi = xz = 0. 5 (或 者 其 他 点 ) 时 的 海 森 矩阵 如 下 : 








ay ay 
ay ay Lg 





9X29T1 ax; 
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明显 是 正定 的 ,我 们 可 以 证 明 在 xz = zx; = 0.5 Wy = 10 f(r, z) 的 一 个 
最 小 值 。 


泰勒 展 式 


假如 一 个 函数 Fe) FE x = x 处 拥有 无 限 阶 导数 (尽管 大 部 分 可 能 是 0) AB 
么 该 函数 可 以 分 解 成 泰勒 展 式 : 





SD = flay) +L ex) + EP G2)" 








oo ~(n) 
= > f Ae (x= [eet 


EP, SORR fn 阶 导 数 ,n! RA n WNR 

只 要 工 充 分 接近 zxo, 同 时 函数 fA(，) 足 够 大 ,那么 ,我 们 只 需要 取 泰 勒 展 式 
的 前 几 项 就 可 能 接近 f(x)。 例 如 ,函数 f(z) 在 z+ 与 zo 之 间 是 二 次 型 的 ,那么 ， 
JCz) 就 可 以 近似 等 于 泰勒 展 式 的 前 三 项 ,因为 剩 下 的 导数 会 很 小 ,可 以 忽略 不 
计 。 同 样 ,如 果 函 数 f(z) 在 x 和 zo 之 间 是 线性 的 ,那么 , f(z) 就 可 以 近似 为 泰 
勒 展 式 的 前 两 项 。 

我 们 可 以 通过 下 面 的 三 次 函数 来 了 解 泰勒 展 式 的 应 用 : 


f(x) =1+2’? +2? 


那么 ,我 们 有 : 
f' (a) 一 2z 十 3z2 


fa) 一 2 十 6z 
fF (= 6 


fo) =0 G>3) 
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取 z = 2, 求 得 各 阶 导 数 的 值 分 别 为 : 
f(2) 一 1 十 (2)2 十 (2)3 一 13 
f (2) = 2(2) +3(2) = 16 
f’(2) 一 2 十 6(2) = 14 
FY Ss 
最 后 ,我 们 利用 z = 2 时 的 泰勒 展 式 来 求 f(x) 在 x = 4 时 的 值 : 


p 
3! 


4—2) 4—2) 





f(4) = f2) -| Lo (4—2) + i” ( 


= 13+16(2) + Bt) +£) 

=g 
K r = 4 RAMAR Re 4 : 

fa 14a ET 
在 这 个 例子 中 ,如 果 取 少 于 4 项 的 泰勒 展 式 , 就 会 得 到 一 个 很 差 的 近似 (因为 这 
是 一 个 三 次 函数 ) 。 
泰勒 展 式 和 近似 可 以 扩展 到 多 变量 函数 中 ,如 果 函 数 是 纯 量 函数 或 者 我 

们 可 以 应 用 一 阶 近似 或 二 阶 近 似 时 ,问题 就 会 变 得 很 简单 。 假 设 y = 
fais Los tts Ln) = f), 同时 我 们 想 知道 OE x = x 处 的 近似 ,那么 f(x) 
的 二 阶 泰勒 展 式 可 近似 为 : 


Fœ ~ f) Hg] Cx = 0) HE a w) HO) w) 


其 中 , f(x) 的 梯度 g(x) = 9y/9x, 海 森 矩阵 H(x) = 92 y/dxdx’, 它们 都 是 在 
x= x 的 情况 下 估计 的 。 我 们 可 以 发 现 , 这 个 展 式 和 方程 2. 1 给 出 的 纯 量 泰勒 
展 式 非常 相似 。 
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积分 学 的 基本 思想 


面积 : 定 积分 


如 图 2. 18, 我 们 首先 考虑 一 下 曲线 f(zx) 下 水 平 坐标 co Fl x 间 所 包含 的 面 
积 。 这 个 面积 可 以 由 以 下 近似 求 得 :把 xz。 和 zz 之 间 的 线段 分 成 n 等 分 ,每 段 长 
度 为 Az, 并 分 别 和 曲线 f(z) 连 接 ,构造 成 一 系列 长 方形 ,如 图 2. 19 所 示 。 那 
么 ,各 个 长 方形 底 边 所 对 应 的 z 坐标 分 别 为 : 


Xs x tA, Xo 十 2Az 9 xo FNAT 


y= f (7) 






rTTTTT 
ay 





Rss 
| 





XI 二 Xo 十 nAX T 


Zo 十 A 工 
2.18 Ağ f(x) 在 xo 和 x 之 间 的 区 域 2.19 ”曲线 以 下 区 域 可 看 做 无 数 长 方形 区 域 之 和 





因此 ,所 有 长 方形 面积 之 和 为 ， 
5 fc +iAr)Ar ~ A 
且 面 积 近 似 会 随 着 值 的 增 大 而 越 来 越 精确 。 用 极限 表示 为 [22] ， 
A= tim >) f(a + idx) Ax 
该 极限 可 以 表示 为 A 一 | fde, Bete (NH 2 = xy Bl 2 = 的 定 积分 ”。 


在 这 里 ,mw 、z 是 积分 域 ,dz 是 长 方形 长 度 Ar 无 限 小 的 量 。 积 分 符号 | 是 拉 
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长 的 “S”, 其 所 表示 的 定 积分 可 以 理解 为 连续 求 和 。 
如 图 2. 20 所 示 , 定 积分 同时 确定 了 面积 的 符号 ,如 果 y 包含 一 些小 于 0 的 
值 ,那么 面积 可 能 为 负 。 





b 
a 


图 2.20 积分 | f(x)dx 为 负 ( 因 为 其 y 值 在 上 下 限 a 和 之 间 为 负 ) 


不 定 积分 


假设 对 于 函数 f(z) ,存在 另 一 个 函数 FCz) ,使 得 : 


F(x 
e ee, 


BD f(z) 是 F(z) 的 导数 ,那么 ,F(z) 就 叫做 “f(z) 的 反 导 数 ” 或 者 “不 定 积 分 ”。 

一 个 函数 的 不 定 积分 不 是 唯一 的 ,因为 假如 下 (z) 是 f(z) 的 反 导 数 ,那么 
G(x) = F(z) 十 c 也 是 (其 中 ,c 是 绝对 常数 而 不 是 x 的 函数 )。 相 反 , 假 如 下 (x) 
和 GCz) 均 为 f(x) 的 反 导 数 ,那么 则 存在 常数 c, 使 得 G(x) = F(x) +e. 


例如 ,f(x) = zx, 函数 Ly 十 10 是 f(x) 的 反 导数 ， Ly —10 Alte 也 是 
其 反 导 数 。 事 实 上 ,任何 F(zx) = Er 十 c 形式 的 函数 都 是 其 反 导数 。 
对 于 不 定 积 分 ,我 们 可 以 写 出 : 


dF (x) 
dx 





= A 
Fis) = | Madde 


积分 符号 在 定 积 分 和 不 定 积 分 中 的 应 用 是 一 致 的 ,并 且 都 称 为 “积分 ”( 这 将 在 
下 文 叙 述 )。 但 是 ,在 不 定 积分 中 ,积分 符号 上 没有 积分 域 ,同时 注意 , 定 积 分 所 
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包含 的 面积 是 一 个 特定 的 数字 ,而 不 定 积分 是 一 个 函数 。 
微 积分 的 基本 定理 


牛顿 和 莱 布 尼 茨 指出 ,曲线 的 反 导 数 和 曲线 以 下 的 面积 存在 一 系列 的 关 
系 。 我 们 把 他 们 所 发 现 的 这 种 不 定 积分 和 定 积分 之 间 的 关系 称 为 " 微 积 分 基本 
定理 ”: 


| "rajde = Flan) —F a) 


其 中 ,下 (。) 是 fC + AIRE. 

以 下 是 一 个 关于 该 定理 的 不 严格 证 明 : 如 
图 2. 21 所 示 ,考虑 曲线 f(x) 下 一 个 定点 xo 和 
一 个 动 点 工 之 间 的 面积 ACz)。A(z) 表 明 面 积 
是 z 的 函数 :面积 随 着 z 由 左 移 向 右 而 改变 。 
在 图 2. 21 P, z 十 Az 表示 一 个 比 x 稍微 偏 右 
的 值 ,AA 表示 xz Alx + Ar 之 间 的 面积 ,这 个 面 
积 可 以 近似 地 看 做 一 个 长 方形 的 面积 : 





图 2.21 BR A(x) ELE xo 
到 x 之 间 的 区 域 


AA ~ f(x) Ar 
同时 我 们 可 以 把 该 面积 表示 为 : 
AA = A(z + Ar) — A(x) 
求 A 关 于 x 的 导数 ,得 到 ， 


dl) = lim 44 = lim es = f(x) 


dx Arr0 AX Ar+0 


最 后 , A) =| f(z)dz 是 f(z) 的 一 个 特别 但 未 知 的 不 定 积分 ,F(z) 是 f(z) 其 


他 特定 的 、 人 为 给 定 的 不 定 积分 。 对 于 一 些 c 值 ,A(z) = F(x) +c (如 前 所 述 ， 
同一 函数 的 两 个 不 定 积分 的 区 别 在 于 常数 c)。 我 们 知道 , AC) = 0, 其 原因 在 
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FA) RAR MAE xo 和 工 之 间 的 面积 ,而 x。 和 zo 之 间 的 面积 为 0, 所 以 ， 
A(x) = Fla) +e =0 
>c =— F(x) 
因此 ,对 于 特定 值 zx = z, 
A(x.) = k f(adx = Fla) — F(a) 


AH, F¢ $ ) 是 fC > ) 的 反 导 数 。 
例如 ,我 们 想 知道 面积 ( 定 积分 ) A 一 | (之 十 3)dz ,该 面积 如 图 2. 22 所 示 ， 
我 们 可 以 方便 地 选择 Fx) 一 村 + 3x, [23] 


y= f @)=z?+3 





Æ 2.2 A= Je +3)dx 所 代表 的 区 域 


A = F(3) 一 下 (1) 


= (483 +3x3)— (+r +3x1) 
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推荐 阅读 


关于 微 积 分 入 门 的 书目 种 类 繁多 ,而 我 仅仅 读 过 其 中 的 一 小 部 分 。 当 然 ， 
我 最 喜欢 的 是 汤普森 (Thompson) 和 加 德 纳 (Garnder) (1998) 的 著作 。 关 于 多 
变量 微 积分 学 在 社会 科学 应 用 中 的 进一步 的 讨论 ,可 参见 宾 默 尔 (Binmore) 和 
戴 维 斯 (Davies)(2001) 的 研究 。 


第 3 章 | 概率 估计 


oe: AMOI we 


本 章 对 应 用 统计 学 中 广泛 运用 的 概率 及 统计 推理 进行 了 概述 。 我 们 知道 ， 
初等 统计 课程 ,尤其 是 社会 学 专业 开设 的 初等 统计 课程 ,对 概率 估计 理论 仅仅 
提供 了 简单 的 框架 介绍 。 然 而 ,深入 了 解 并 熟悉 有 关 话 题 的 背景 知识 是 相当 必 
要 的 。 


初等 概率 理论 


概率 基础 


在 概率 理论 中 ,实验 是 对 观察 的 可 重复 验证 过 程 ;结果 是 通过 对 一 个 可 能 
的 观察 进行 实验 所 得 出 的 结论 ;实验 的 样本 空间 则 为 所 有 可 能 结果 的 集合 。 实 
验 的 任何 特定 “实现 ”都 会 在 样本 空间 中 产生 一 个 特定 的 结果 。 样 本 空间 可 以 
是 离散 且 有 限 的 ,或 者 是 离散 且 无 限 的 ,也 可 以 是 连续 的 。 例 如 , 掷 两 次 硬币 ， 
然后 记录 下 每 次 投掷 的 结果 (出 现 的 是 硬币 的 正面 还 是 反面 )。 对 于 此 例 , 实 验 
的 样本 空间 是 离散 且 有 限 的 ,其 结果 组 合 为 S= (HH, HT, TH, TT}. 如果 
我 们 反复 搓 硬 币 , 并 记录 每 次 投掷 的 结果 ,此 时 样本 空间 是 离散 且 无 限 的 ,其 包 
括 的 正 整数 组 合 有 S= (1, 2, 3, …)} 。 [24j 如 果 我 们 把 灯泡 一 直 开 着 直到 保险 
丝 烧 断 ,并 记录 下 灯泡 从 打开 一 直到 自然 熄灭 所 需要 的 时 间 , 此 时 实验 的 样本 
空间 就 是 连续 的 ,其 包括 所 有 的 正 实数 (这 里 无 需 明确 指出 灯泡 寿命 的 上 限 ): 
S= {z:+ 之 0)。 在 本 节 中 ,我 叙述 的 内 容 仅 限于 样本 空间 是 离散 且 有 限 的 
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一 个 事件 是 实验 的 样本 空间 子 集 , 即 结果 集合 。 如 果 包 含 在 结果 集合 中 的 
情况 发 生 ,我 们 就 说 该 事件 在 实验 中 发 生 。 例 如 ,对 于 S= (HH, HT, TH, 
TT), 如 果 我 们 得 到 结果 HH K HT, MEF E = (HH, HT) 代表 第 一 次 掷 
硬币 出 现 正面 ) 发 生 。 请 注意 ,通过 以 上 定义 ,样本 空间 S 本 身 和 不 包含 任何 事 
件 的 零 或 空 事 件 8 = {) 都 是 事件 。 





概率 论 定理 
令 S= {ol， O29 **s On} } 表示 实验 的 样本 空 si]; O = {01}; Oz = {02}; 0, 
O, = 表示 单一 事件 , 且 每 个 事件 包含 一 个 结果 ;事件 E= (005 0,,…, On)» 


为 S 的 一 个 子 空间 (下 标 a, 5,…, m 是 1 到 之 间 的 不 同 数字 )。 概 率 是 满足 
如 下 定理 的 事件 所 发 生 的 可 能 性 [25] : 


Pl: Pr(E) >0: 一 个 事件 发 生 的 概率 是 非 负 的 ; 

P2: Pr(E) = Pr(O,) 十 Pr(O,) 十 … 十 Pr(O,)，, 一 个 事件 发 生 的 概率 为 
所 有 构成 其 结果 的 和 。 

P3: Pr(S) 和 1 和 Pr(O) = 0: 样本 空间 是 穷尽 的 , 即 某 些 事件 必然 
发 生 。 


假设 样本 空间 S= (HH, HT, TH, TT) 包含 所 有 结果 , 且 每 个 结果 发 生 
的 可 能 性 相同 , 即 : 
Pr(HH) = Pr(HT) = Pr(TH) = Pr(TT) = 0. 25 


那么 ,对 于 事件 E= (HH, HT}, Pr(E) = 0.25 十 0.25 = 0.5。 这 个 例子 比较 
简单 ,因为 每 个 结果 发 生 的 概率 都 相同 ,正如 扔 硬币 得 到 正 反 面 的 概率 相同 一 
样 。 实 际 上 ,只 要 各 结果 发 生 概 率 之 和 为 1, 即 符合 以 上 定理 。 

在 经 典 统计 学 中 ,并 且 从 大 多 数 统计 学 应 用 的 角度 来 看 ,概率 是 指 长 期 的 
均衡 比例 。 即 ,假如 一 个 事件 发 生 的 概率 为 二 元 那么 当 实 验 重 复 多 次 ,这 个 事件 
发 生 的 概率 会 接近 于 0. 5, 而 这 个 接近 Aish cena 。 这 是 
客观 论 者 对 概率 的 一 般 性 理解 :概率 为 长 期 的 相对 频率 , 即 均衡 比率 。 
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事件 之 间 的 关系 、 条 件 概率 与 独立 事件 

事件 之 间 存 在 许多 重要 的 关系 。 两 个 事件 E 和 E: 的 交集 , 记 做 五 N E, 
它 包括 两 个 事件 中 共有 的 所 有 结果 。 因 此 PrE N E) 表示 E ME 同时 发 
生 的 概率 。 如 果 E N E: = Ø, NPE ME, 无 交集 或 者 互 斥 。 推 广 后 ,可 以 
知道 ,一 系列 事件 的 交集 E NEN OE, 包含 事件 El 到 事件 E 共有 的 所 有 
结果 。 例如, 我们 有 事件 E = (HH, HT) ERE EM), E = 
(HH, TH) BRKE EDA E = (TH, TT) 第 一 次 掷 硬币 出 现 
反面 ), 那 么 ,可 知 E N E: = {HH}, E N E = Ø, E N E ={TH}. 

两 个 事件 E ME 的 并 集 五 UE, 包含 两 个 事件 中 所 有 的 结果 ;Pr(E UE) 
是 事件 E 或 者 事件 Ez 发 生 的 概率 。 那 么 ,事件 E UEa U UE, 的 并 集 是 已， 
到 E 中 含有 的 所 有 结果 。 如 果 这 些 事件 无 交集 ,那么 ， 


k 
Pr(E; U Ex U … U Ex) = >) Pr(E,) 
i=1 
否则 ， 
k 
Pr(E, U E: U = U Ex) < >) Pr(E,) 
i=l 


由 于 不 同事 件 中 所 包含 的 结果 可 能 有 重复 ,因此 某 些 事件 发 生 的 概率 之 和 可 能 
大 于 1。 因 此 ,任意 两 个 事件 发 生 的 概率 为 : 


Pr(E, U E,) = Pr(E, ) + Pr(E:) — Prt ky N E) 


即 两 个 事件 分 别 发 生 的 概率 之 和 减 去 两 个 事件 交集 发 生 的 概率 (因为 在 算 两 个 
事件 分 别 发 生 的 概率 之 和 时 ,交集 部 分 被 算 了 两 次 )。 由 此 ,可 引申 到 事件 发 生 
概率 相同 的 例子 (如 前 所 述 ,E 和 E: 无 交集 ,而 E 和 E 有 交集 ): 


Pr(E, U E) = Pr(HH, HT, TH, TT) = 1 
= Pr(E,) + Pr(E;) 


= 0.5-+0.5 
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Pr(E, U E:) = Pr(HH, HT, TH) = 0.75 
= Pr(E,) + PrE) — Pr(E, (1 E2) 


= 0, 5+0. 5—0. 25 
给 定 事件 E 、 事 件 E: 发 生 的 条 件 概率 为 : 


Pr(E, N E) 


Pr(E, | E) = Pr(E,) [3. 1] 


条 件 概 率 可 以 这 样 解释 :如 果 已 知事 件 已 | 会 发 生 ,那么 求 事件 E: 发 生 的 概率 。 
为 求 得 PrE NE) ,我 们 解 方程 3. 1 即 可 得 到 一 般 概率 的 乘法 法 则 : 


Pr(E, N E1) = Pr(E,)Pr(E, | FE) 
交换 E 和 E: 的 角色 后 ,得 到 以 下 方程 : 


PrE: N E) 


Pr(E, | E) = Pr(E,) [3. 2] 


Pr(E, N E) = Pr(E,)Pr(E, | E,) [3. 3] 


如 果 Pr(E; N Ei) = Pr(E)Pr(E;), 我 们 说 这 两 个 事件 为 独立 事件 。 方 程 
Pr(E N Ei) = Pr(E,)Pr( Ex) 称 为 “独立 事件 概率 的 乘法 法 则 ”。 事 件 已 和 事 
F E: 的 独立 性 暗示 了 Pr(Ei) = Pr(CE | E,) 和 Pr(E,) = Pr(E; | E), 即 两 个 
独立 事件 的 无 条 件 概 率 与 已 知 其 中 一 个 事件 会 发 生 时 , 另 一 个 事件 的 发 生 概率 
相同 。 推 广 后 可 知 ,车 已 知 一 系列 独立 事件 {El ,EE ,…， Ex} ,那么 ,对 于 发 生 
其 中 任意 两 个 或 多 个 事件 的 子 集 的 概率 为 : 


Pr(E, N E N e N En) = Pr(E,) Pr(E;)+**Pr( En) 
因此 , 若 已 知 第 一 次 掷 硬 币 得 到 硬币 正面 , 则 第 二 次 掷 硬 币 也 为 正面 的 概率 为 : 


Pr(F, N E) 
Pr(E) 


_ 0.25 
0.5 


— Pr(E; ) 


Pr(E, | E) = 
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同 理 ,Pr(E, N E) = 0. 25 = Pr(E,)Pr(E,) 一 0.5X0.5。 因 此 ,事件 E, 和 事 
件 E: 是 独立 事件 。 

两 个 事件 独立 与 两 个 事件 互 斥 不 同 ,因为 两 个 事件 互 斥 暗示 了 它们 不 可 能 
一 起 发 生 , 所 以 ,它们 是 互相 依赖 的 。 在 我 们 的 例子 中 ,事件 E 和 事件 E: 是 独 
立 但 不 互 斥 的 : E N E: = {HH} 4 Ø. 

事件 E 和 事件 Es 的 差 包 含 了 所 有 在 事件 E 中 发 生 而 没有 在 事件 E, 中 
发 生 的 结果 , 记 做 Ei — E: 。 那 么 实验 样本 空间 包含 的 所 有 事件 与 事件 的 差 称 
为 “事件 E Wehbe”. H PrCE) = 1 一 Pr(E)。 对 于 之 前 提 到 的 例子 ,结果 发 生 概 
率 相同 的 事件 互 = (HH, HT), 其 补 集 发 生 的 概率 为 Pr(E) = Pr(TH, TT) = 
0.5 = 1 一 0.5。 

Bonferroni 不 等 式 

SE=ENEN NE, IA E = E U EU…U EE, 运用 之 前 的 
方程 ,有 : 

Pr(E; N Ex N + N EÐ) = Pr(E) = 1—Pr(E) [3.4] 


k 一 一 
>1— 5) Pri E;) 
i=1 


BERAE E, Ex, +, Ex 发 生 的 概率 都 相等 ,那么 对 于 任意 E, HRE 
概率 都 等 于 Pr(E;) = 1 一 5。 那么， 
Pr(E. AN E, N +E.) =1—-a . ES 5] 
>1— kb 


方程 3. 5 与 一 般 方程 3. 4 都 称 为 “Boneferroni 不 等 式 ”。 

方程 3. 5 对 线性 联 立方 程 的 应 用 有 以 下 暗示 :假设 0 是 每 & 个 非 独立 统计 
检验 的 1 类 错误 比率 (例如 ,显著 水 平 a) ,a 表示 合并 的 工 类 错误 比率 , 即 & 个 非 
独立 统计 检验 中 至 少 错误 地 拒绝 了 一 个 为 真 的 零 假 设 的 概率 ,那么 , a<kb. Bil 
如 ,我 们 在 0. 01 显著 水 平 下 检验 20 个 为 真 的 统计 假设 ,那么 至 少 错误 地 拒绝 了 
一 个 为 真 的 零 假设 的 最 大 概率 为 20 X 0. 01 = 0. 20, 即 5 个 为 真 的 假设 检验 中 
就 有 一 个 被 当做 错误 假设 被 拒绝 。 这 提醒 我 们 ,有 时 天 真 的 “数据 发 据 ” 可 能 会 
导致 严重 的 错误 。 
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随机 变量 


随机 变量 是 定义 在 样本 空间 上 取 值 为 实数 的 函数 。 对 于 之 前 所 提 及 的 样 
本 空间 S= (HH, HT, TH, TT), 一 个 记录 掷 硬币 结果 为 正面 的 随机 变量 
X 可 定义 为 : 





结果 X 的 取 值 
HH 2 
HT 1 
TH 1 
TT 0 





对 于 此 例 ,如 果 X 为 离散 随机 变量 ,那么 ,我 们 通常 把 Pr(X = x) 写成 
p(x) ,其 中 ,大 写字 母 X 代表 随机 变量 ,小 写字 母 zx 表示 变量 的 特殊 值 .26 例如， 
掷 硬币 实验 的 4 个 结果 发 生 的 概率 均 为 0. 25 ,那么 出 现 正面 的 概率 分 布 为 : 








x pla) 

{TT}—> 0 0. 25 
{HT, TH}—> 1 0. 50 
{HH}— 2 0. 25 

总 计 1. 00 


该 表 记 录 了 所 有 事件 匹配 到 每 个 随机 变量 zx 值 后 的 结果 。 
一 个 随机 变量 X 的 累积 分 布 函数 CDF 给 出 可 观测 到 的 变量 值 小 于 或 者 等 
于 某 个 特殊 值 的 概率 , 记 做 Pa): 


P(x) = Pr(X < x) = Dip’) 


xr 


对 于 上 述 例 子 : 
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如 果 随 机 变量 是 在 一 个 连续 变量 空间 中 定义 的 ,那么 ,这 些 随机 变量 本 身 
也 可 能 是 连续 的 。 这 里 ,我 们 仍然 用 p(x) 代 表 Pr(X 达 x), 但 是 ,对 于 随机 变量 
X 的 每 一 个 具体 值 来 说 [27] ,这 种 表示 就 会 显得 没有 意义 。 概 率 密度 函数 pla) 
是 离散 概率 分 布 的 连续 模拟 ,定义 为 p(x) = 4P(z)/dzx 。 28] 变换 后 得 到 [29] ; 


P(x) = | pdr 


Pr(xo S X S< 11) = P(x) — Pla) = | pode 


因此 ,如 图 3. 1 所 示 , 密 度 函 数 以 下 的 区 域 代表 概 率 .[30] 


户 (Z) 
Pr(q<r<2,) 


To Tı 


图 3.1 概率 密度 曲线 p(x) 以 下 的 区 域 为 概率 





最 简单 的 连续 概率 分 布 是 均匀 分 布 : 
0 a>x 
pa) =47 + a<xr<b Ei 
0 Tb 


其 密度 函数 见 图 3. 2(a) ,相应 的 累积 分 布 函数 见 图 3. 2(b) 。 密 度 函 数 下 方 整个 
区 域 的 大 小 为 1。 这 里 ， 


co b 
[ pide =| pdr =; a) = 1 
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P(a) 





Pen 


1 1 
1 1 
1 1 
1 1 
1 1 
0 a 5 = 





(a) 
图 3.2  (a) 均 匀 分 布 的 概率 密度 函数 p(x)j 和 {b) 均 匀 分 布 的 累积 分 布 函数 plx) 
一 个 随机 变量 的 支持 是 一 组 概率 或 者 概率 密度 不 为 0 的 数值 。 因 此 ,均匀 分 布 
的 支持 为 a 三 X 达 6b。 
随机 变量 的 两 个 基本 属性 是 其 期 望 值 (或 平均 值 ) 和 方差 .131] 从 期 望 值 可 
以 知道 随机 变量 概率 分 布 的 中 心 (这 道理 就 如 同一 系列 取 值 的 均值 指明 了 由 这 
些 取 值 所 构成 的 分 布 的 中 心 ) ,方差 记录 了 分 布 相 对 于 期 望 值 的 分 散 程度 。 随 
机 变量 的 期 望 值 为 随机 变量 通过 多 次 重复 试验 得 到 的 取 值 的 均值 ,方差 为 取 值 
和 期 望 值 之 间 的 均 方 距离 。 
对 于 离散 事件 ,随机 变量 X 的 期 望 值 记 做 E(X) 或 者 px ,表示 为 : 
E(X) = rp (2) 
all X’ 
对 于 连续 事件 ,随机 变量 X 的 期 望 值 表示 为 [32] : 
E(X) = | ptdr 


一 个 随机 变量 X 的 方差 记 做 V(X) 或 者 cx ,定义 为 : 
V(X) = EL(X— yx)’] 
= EX) — ik 
因此 ,对 于 离散 事件 ， 
Vio = > (x — px)’ p(x) 


那么 ,对 于 连续 事件 ， 
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VCOO =| (pr) pn) dr 


随机 变量 的 方差 是 用 平方 单位 来 表示 的 (例如 , “出 现 正面 的 次 数 的 平方 ”) ,但 
是 标准 差 o 三 十 Vo 的 量度 单位 与 变量 相同 。 











对 于 我 们 的 例子 ， 
x p(x) xp(x) rp (a—px )? p(x) 
0 0. 25 0. 00 =, 0. 25 
1 0. 50 0. 50 0 0. 00 
A 0. 25 0. 50 1 0. 25 
总 计 1. 00 p=1. 00 o=0. 50 





因此 , EX) = 1, V(X) = 0.5, o = V0.5 © 0.707。 同样 ,对 于 均匀 分 布 ( 方 
程 3. 6)， 





E(X) = fz (z4) = aa. 





V(X) =| (x eari L ii = ae 


两 个 离散 随机 变量 X, 和 Xe 的 联合 概率 分 布 提供 了 同时 观测 到 两 个 变量 
的 任意 一 对 取 值 的 概率 。 我 们 把 PrCX 一 ay 和 Xs = r) TE pu Ces zs)。 但 
是 p 的 下 标 时 常会 引起 歧义 ,因此 ,我 们 将 其 简化 为 PCzi ，z)。 两 个 连续 变量 
的 Ps zs) 的 联合 概率 分 布 与 离散 变量 的 定义 类 似 。 多 个 随机 变量 的 联合 概 
率 分 布 的 表示 方法 为 P(x» L2, s Ln) 0 

不 同 于 随机 变量 的 联合 概率 分 布 , p(x) 为 随机 变量 X 的 边缘 概率 分 布 或 者 
边缘 概率 密度 。 其 中 , p(n) =D), pony m2) RH pa) 一 | pla, mde, 
我 们 常常 忽略 下 标 而 将 其 记 做 p(x1)。 

在 一 个 据 硬 币 实验 中 ,我 们 用 X 记录 出 现 正面 的 次 数 ,并 定义 X = 1 时 ， 
两 次 掷 硬币 得 到 的 结果 相同 , Xo = 0 时 ,两 次 掷 硬币 的 结果 不 同 , 那 么 ， 
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结果 Pr 0 X2 
HH 0. 25 2 1 
HT 0. 25 1 0 
TH 0. 25 1 0 
TT 0. 25 0 1 
随机 变量 X 和 X; 的 联合 边缘 分 布 如 下 表 所 示 : 
Plas x2) 
X2 | 
Ži p(x) 
To 
0 0 0, 25 0. 25 
0. 50 0 0. 50 
2 0 0. 25 0. 25 
pla) 0. 50 0. 50 1. 00 





给 定 Xo» Xi 的 条 件 概率 或 者 条 件 概率 密度 为 : 


i pelti, 22) 
p(x) 


力 Xi | za 


与 之 前 相同 ,为 方便 起 见 ,我 们 常常 会 省 略 下 标 , 记 做 p(xi | zz )。 对 于 该 实验 ， 
4 z= 1 时 和 当 x: 一 0 时 ,条 件 概率 play |zz ) 为 : 





























p(x |x) 
T2 

Tı 

0 1 
0 0 0.5 
al 1.0 0 
2 0 0.5 

总 计 1.0 1.0 


给 定 X = zo AY Xl 的 条 件 期 望 值 记 做 Fiz (Xi |x.) MA E(X; |r), É 
是 从 条 件 分 布 puC le TSR). FE, RE X: = a 时 ,Xi 的 条 件 方差 记 做 
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Vio (XI | zz ) 或 者 V(X | zz ) 。 对 于 一 个 离散 事件 ， 


E(X: | zz) = Sepia | x2) 


Vizs (Xi | 22) = > [zi — En (Xi | x2) J pula | x2) 


将 具体 数值 代入 后 ,得 到 : 
Ey).(X, | 0) = 000) +101) +0(2) = 1 
Vie (X | 0) = 000-1)? +10 — 1)? +0(2— 1)? = 0 


E(X: | 1) = 0.500) +001) +0. 5(2) = 1 








Vij2(X | 0) =0.5(0— 1) +001 —- 1)? +0.5(2—- 1)? = 1 


如 果 对 于 随机 变量 X 和 X; 的 任意 取 值 ,都 有 pai) = pln | 22). ABA, 
我 们 说 X AX, 是 独立 随机 变量 。 也 就 是 说 ,如 果 X 和 X; 为 独立 随机 变量 ， 
那么 ,Xi 的 条 件 分 布 与 边缘 分 布 是 等 价 的 。 对 于 以 上 题 设 ,其 独立 性 的 等 价 条 
EBA pla) = pla | x1); par, x2) 二 p(Xi)p(zz), 当 Xl 和 XX 为 独立 随机 
变量 时 ,它们 的 联合 概率 或 者 概率 密度 是 它们 边缘 概率 或 概率 密度 的 乘积 。 在 
此 例 中 ,Xi MX 明显 不 是 独立 随机 变量 。 推 广 之 ,对 于 包含 ”个 随机 变量 的 
独立 集合 {X!，X: ，…，X,) ,其 每 个 子 集 (X。, Xos ts Xn} mD 有 : 


Denas Loo eo Ba) = Pta ID) Plan) 
两 个 随机 变量 的 协 方差 为 它们 是 否 线性 独立 的 量度 : 


CCX, ’ X,) =g = EL(X, — pn )(X2 — pz )] 


E(X, X2) ~~ yı 


当 随 机 变量 Xi 较 大 的 取 值 与 随机 变量 Xs 较 大 的 取 值 相关 时 ,其 协 方差 为 正 ; 
当 随 机 变量 X 较 大 的 取 值 与 随机 变量 X 较 小 的 取 值 相关 时 ,其 协 方差 为 负 
(反之 亦 然 ); 当 两 个 随机 变量 属于 独立 随机 变量 时 , 协 方差 为 0, 但 是 随机 变量 
的 独立 性 并 不 是 协 方差 为 0 的 充分 必要 条 件 , 即 两 个 随机 变量 可 呈现 非 线性 相 
关 , 此 时 协 方差 仍 可 为 0。 在 之 前 的 例子 中 ,X! 和 X 并 不 是 独立 随机 变量 ,但 
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是 mo 无 疑 为 0( 读 者 自己 可 以 证 实 )。 变 量 本 身 的 协 方差 就 是 其 本 身 的 方差 ， 
CX, X = V(X). 

随机 变量 X, AIX. 的 相关 性 ps = ow2/o1os 是 个 标准 化 后 的 协 方差 。 相 关 
性 的 最 小 值 p = 一 1, 它 表示 随机 变量 之 间 存在 完美 的 反 线性 关系 。 同 样 ,相关 
性 的 最 大 取 值 是 p = 1, 它 表示 随机 变量 之 间 存 在 完美 的 正 线 性 关系 。 当 p= 0 
时 , 协 方差 为 0, 此 时 随机 变量 间 不 存在 线性 关系 。 

随机 向 量 为 方便 起 见 ,我 们 常常 将 一 系列 随机 变量 写成 一 个 随机 向 量 。 例 
如 x 二 [Xi, Xos ers X J ,一 个 随机 向 量 的 期 望 值 就 是 其 中 元 素 的 期 望 值 组 





成 的 向 量 , 记 做 : 
E(x) = pr = LE(X), E(X:), «5 E(X,) |’ 
随机 向量 
x 的 方差 一 协 方差 矩阵 定义 与 纯 量 方差 类 似 ,表达 式 为 : 
|o O12 “°? Øi» 
021 o 02 
VO = Z a = EL m) (x mw) |] = . . 
On On o 





V(%) 的 对 角 元 是 变量 X 的 方差 , 非 对 角 元 是 其 协 方差 。 方 差 一 协 方差 矩阵 
VCO 是 一 个 对 称 半 正 定 矩阵 。 两 个 随机 向 量 x 和 y 的 协 方差 矩阵 表示 为 ; 





Oxy, Ox, y, Ox, y, 
7 Or, y, Oz, y, Oxz, y, 

C(x, y= Ew = E[ (x—m)(y— w) ] = 
zy Ory ° Oxy, 


其 包括 了 所 有 随机 向 量 X ALY 内 所 有 元 素 的 所 有 对 协 方差 。 
随机 变量 的 变换 


假设 随机 变量 Y 是 随机 变量 X 的 线性 函数 a 十 bX( 其 中 ,a、5 为 常数 ) ,X 
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的 期 望 值 和 方差 分 别 为 wx 和 ox ,那么 ， 
E(Y) = py = >) (a+ar) p(x) 
= a>) p(x) +b») xp(x) 


= a 二 bx 


VY) = EL(Y— py)? ] = E{L(a+ 6X) — (a bux)]) 





= PEUX — px)? ] = Bok 
现在 ,假设 Y 是 两 个 随机 变量 X! M X 的 线性 函数 a Xi 十 az X:  ，X MX: 
所 对 应 的 期 望 值 分 别 为 pa. peo TT FED of. of DTH on. IA, RN 
得 到 : 
EY) = pw = >, X airi +4222) plti, x2) 
= > Sax pla 5 2) + X, Xarpa » T2) 
=a, >) ri p(z) +a: >) 22 ple) 
= am azp 
V(Y) = E[ Y — py)’ ] 
= E{[(axi 十 azxs) an (ay pai + ary.) |} 
= al ELX, — m) ] +a, ELX: — w)’ ] 
十 2a1az El (X, — pn) (Xz — po) J 


22 2 2 
= ajo, + az02 + Za1a2012 


其 中 ,Xi 和 X: 是 独立 随机 变量 ,因此 os = 0, 那么 ,以 上 表达 式 可 简化 为 
V(Y) =aioi +030 

连续 事件 的 规则 与 离散 事件 相同 。 例 如 ,如 果 Y = a 十 bx 是 一 个 连续 变量 
X 的 线性 函数 ,那么 [33]， 
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E(Y) = i Ca te pede 


= a| pedr +f xp (x)dx 
=a+bE(X) 
随机 向 量 的 变换 
将 以 上 结论 推广 到 随机 向 量 中 后 ,我 们 得 到 :如果 y 是 随机 向 量 x 的 线 
性 变换 A x ,随机 向 量 x 的 期 望 值 是 E) = px， 方差 -- 协 方差 矩阵 为 


Vix) = Za, WA: 
E(y) = py = Apx 


VO = Ey = AXA’ 


如 果 随 机 向 量 x 的 元 两 两 独立 ,那么 ,所 有 的 非 对 角 元 都 为 0,y 中 每 个 元 的 方差 
可 简单 表示 为 : 


n 

2 . 2 2 

oy 一 QjOx, 
j=1 


有 时 ,对 于 y 二 f(x), 我 们 需要 知道 的 不 仅 是 El(y) 和 V(y), 还 有 y 的 概率 
分 布 。 而 且 , 变 换 操作 f(，) 也 有 可 能 为 非 线 性 操作 。 假 设 y 和 x 中 的 元 素数 
目 相等 ( 均 为 n)、f 函数 是 可 微 的 、f 与 x 的 范围 内 的 值 是 一 一 对 应 的 (每 一 个 x 
都 对 应 一 个 唯一 的 y) , 且 最 后 一 个 属性 暗示 了 该 函数 有 反 函 数 x = f(y). AB 
么 ,y 的 概率 密度 可 表示 为 : 


ply) = p(X) = p(x) 








de (2) | 





de ($5) 


其 中 , | det(9x/ay)| 叫 做 “ 雅 可 比 迭 代 ”, 它 是 (n X n) 行列 式 的 绝对 值 : 








aX, eee IX, 

JY, JY, 
det| : : 

aX, | aX, 





IY, ay, 
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|det(ay/ax) | 的 定义 与 1det(9x/9y) | 类 似 。 


离散 概率 分 布 


在 本 章节 ,我 主要 对 一 些 重 要 的 离散 概率 分 布 类 进行 详解 ,如 二 项 分 布 与 
伯 努 利 分 布 . 多 项 分 布 . 泊 松 分 布 (该 分 布 可 构建 出 近似 二 项 分 布 ), 还 有 负 二 项 
分 布 。 我 们 所 说 的 概率 分 布 ( 例 如 ,二 项 分 布 ) 其 实 是 一 个 类 ,但 为 方便 起 见 , 我 
们 只 说 二 项 分 布 。 本 章节 的 有 关 离 散 分 布 的 内 容 和 之 后 连续 分 布 的 内 容 均 在 
统计 推理 和 统计 建 模 中 扮演 着 非常 重要 的 角色 。 


二 项 分 布 和 伯 努 利 分 布 








前 文 提 到 的 掷 硬币 实验 引出 了 一 个 二 项 分 布 随机 变量 ,该 变量 记录 了 一 个 
硬币 两 次 投掷 后 得 到 正面 的 次 数 。 将 此 例 引申 后 ,我 们 让 随机 变量 X 记录 一 个 
硬币 ”次 投掷 后 得 到 正面 的 次 数 。 其 中 ,表示 任意 投掷 得 到 正面 的 概率 (不 一 
定 为 0.5), 1 一 则 为 得 到 反面 的 概率 .[34] 那 么 ,观测 到 个 正面 和 ?一 工 个 反 
面 的 情况 可 用 一 个 二 项 分 布 来 表示 : 


72 
x*(1—2n)”"" [3.7] 


Xx 


pla) = 








其 中 ,x 是 0 到 的 任意 整数 ,因子 (1 一 x)" 是 在 特定 情况 下 观测 到 x 个 正 
面 和 一 x 个 反面 的 概率 。(”)==n!/[z!1(n 一 z)!] 是 二 项 系数 , 它 是 出 现 z 个 
正面 入 一 xz 个 反面 的 所 有 组 合 的 数量 .135] 

二 项 分 布 随 机 变量 X 的 期 望 值 为 E(X) = nx, 方差 为 V(X) = mAr). 
图 3.3 展示 了 当 n 二 10 及 x 二 0.7 时 的 二 项 分 布 。 如 果 乘 积 项 nx 和 nn(1 一 x) 
足够 大 (例如 ,都 至 少 等 于 10) ,那么 离散 二 项 分 布 可 以 近似 看 做 连续 正 态 分 布 ， 
且 其 均值 和 标准 差 都 与 连续 正 态 分 布 相同 。 
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图 3.3 n= 二 10 及 X= 0.7 时 的 二 项 分 布 


二 项 分 布 随机 变量 与 伯 努 利 随 机 变量 不 同 , 后 者 在 取 0 和 1 的 时 候 所 对 应 
的 概率 分 别 是 x 和 1 一 x, 其 均值 和 方差 分 别 为 下 (X) = r, VX) =r- r), 
伯 努 利 随 机 变量 可 以 用 来 对 一 次 投 撞 建 模 。 例 如 ,假设 X = 1 为 出 现 硬币 的 正 
面 , X = 0 为 出 现 硬币 的 反面 ,那么 ,独立 且 同 分 布 的 伯 努 利 变量 的 加 和 是 一 个 
二 项 分 布 。 


多 项 分 布 





假设 在 ”次 重复 独立 的 实验 中 ,每 一 次 实验 的 结果 都 出 现在 & 个 不 同 的 
结果 类 别 中 (对 于 该 实验 ,总 共 会 出 现 & 种 结果 ) 。 我 们 让 随机 变量 X: 表示 类 
别 i 中 的 结果 数量 ,让 m 表示 每 次 实验 的 结果 落 入 类 别 i 中 的 概率 。 那 么 ， 
Dx =1, 2 A =ñ. 

如 果 我 们 找 BF LE X 记录 出 现 1 的 次 数 ,Xs* 记录 出 现 2 的 次 数 …… 
Xs 记录 出 现 6 的 次 数 。 因 此 ,& = 6,m 表示 掷 出 1 的 概率 ,xz 表示 掷 出 2 的 概 
BSS. WRK MES RS. AS Te EA R, UA m = 
m =" = m = 1/6, 

推广 到 一 般 情 况 可 知 ,如 果 向 量 随 机 变量 x 二 [LX!, X:,…, XJ] 符合 多 项 
分 布 , 则 有 : 
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nl 


rr eM eeey 
1 2 k 
mw brs lpi! 


pcx) = play » T29 "ys T) = 


该 公式 的 原理 与 二 项 分 布 公式 相似 , 即 oc y ene 分 别 为 在 特定 情况 下 ,结果 在 
类 别 1 中 出 现 的 概率 ,结果 在 类 别 2 中 出 现 的 概率 ,等 等 。n!/(xi! zs! sre!) 
记录 了 不 同 组 合 的 个 数 。 如 果 & = 2, 那么 , zx; 二 nn 一 x1, 此 时 ,多 项 分 布 即 简化 
为 二 项 分 布 (见方 程 3. 7)。 

随机 向 量 x 中 ,元 素 的 期 望 值 为 E(X;) = nr, 方差 为 V(X;) = nri(1 一 和 元)， 
其 对 应 的 协 方差 为 C(X;, X) = 一 nninj。 


泊 松 分 布 


19 世纪 法 国 数学 家 西蒙 - 丹 尼 ' 泊 松 (Simeon-Denis Poisson) 引 入 了 以 其 
名 命名 的 一 个 近似 二 项 分 布 。 该 近似 在 足够 大 、x 足够 小 且 其 乘积 4 = m 适 
中 的 情况 下 成 立 。 泊 松 分 布 的 表达 式 为 : 


ate) we EN E E A A PE 


žl 





尽管 X 所 包含 的 均 是 非 负 整数 ,但 由 于 p(x) ~ 0, 因此 该 近似 只 有 在 工 足够 大 
的 情况 下 才 可 行 (这 里 ,e 是 一 个 数学 常数 , e ~ 2. 71828 )。 

泊 松 分 布 只 用 于 极 少见 或 不 经 常 发 生 的 现象 。 假 设 我 们 所 观测 到 的 过 
程 所 产生 的 事件 比较 特殊 (如 出 生 或 者 其 他 自发 事件 ) ,对 于 事件 X, 我 们 会 
记录 下 其 在 某 个 固定 时 间 段 发 生 的 次 数 , 如 果 该 发 生 次 数 符合 以 下 条 件 , 则 
其 遵循 泊 松 分 布 :(1) 尽 管事 件 发 生 的 时 间 是 随机 的 ,但 是 在 某 个 观测 间隔 
下 ,其 发 生 率 是 固定 的 。(2) 如 果 我 们 将 注意 力 放 在 一 个 充分 小 、 间 隔 长 度 
为 ;的 子 间隔 内 ,那么 ,在 该 间隔 内 观测 到 一 个 事件 的 概率 与 其 所 在 的 间隔 
长 度 1s 成 正比 ,在 该 间隔 内 观测 到 多 于 一 个 时 间 的 概率 几乎 小 到 可 以 忽 
略 。 这 样 , 参 数 4 即 事件 的 发 生 率 。(3) 在 不 重 又 子 区 间 发 生 的 事件 是 独立 
事件 。 

泊 松 随机 变量 的 期 望 值 是 EE(X) = 4, 其 方差 V(X) 也 是 A*。 图 3. 4 描述 了 
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012345678910111213141516 
Æ 


图 3.4 参数 为 4 二 5 的 泊 松 分 布 


负 二 项 分 布 


假设 在 掷 硬 币 实验 中 ,每 次 投掷 都 是 独立 的 ,并 一 直 持 续 到 一 个 目标 数量 ， 
如 出 现 * 个 正面 后 停止 ,此 时 ,我 们 让 随机 变量 X 记录 目标 数量 达到 前 ,出 现 反 
面 的 次 数 。 那 么 ,X 遵循 一 个 负 二 项 分 布 , 其 概率 分 布 的 表达 式 为 : 


p(x) = (TET am (z = 0, l, Ze see) 


其 中 ,x EUR PE hh SIE A KM — 4) fp BB ECX) = s(1 一 
r)/r，, 方差 为 V(X) =s—r)/r . 图 3.5 表示 当 s = 二 4 及 x = 0.5 时 的 负 二 项 
分 布 。 





图 3.5 ss 三 4 及 三 0.5 时 的 负 二 项 分 布 
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连续 分 布 


在 本 章节 中 ,我 会 介绍 一 些 重要 的 连续 分 布 类 型 ,如 正 态 分 布 、 卡 方 分 布 t 
分 布下 分 布 、 多 元 正 态 分 布 指 数 分 布 逆 高 斯 分 布 \Y 及 B 分布。 
TESS th 


正 态 分 布 (或 高 斯 分 布 ) 随 机 变量 X 的 概率 密度 函数 为 : 








1 (z — W)? 
J—exp|- 27 (— 0 < q< 0) 


p(z) = 


oO 


其 中 ,分 布 参 数 j 和 o? 分 别 为 X 的 均值 和 方差 。 因 此 ,对 于 每 个 kw 和 o? ,都 有 一 
个 不 同 的 正 态 分 布 。 图 3. 6 给 我 们 列 出 了 几 个 例子 。 正 态 分 布 常见 的 缩写 形式 
为 X~ NG 0 ), 它 表示 六 是 一 个 以 j 为 均值 ,以 到 为 方差 的 正 态 分 布 .[36] 尽 
管 法 国 数学 家 亚伯拉罕 。 棣 莫 弗 (Abraham de Moivre) E F 1973 年 第 一 次 引入 
了 这 个 近似 二 项 分 布 的 概念 ,但 是 高 斯 分 布 仍 是 以 伟大 的 德国 数学 家 卡尔 。 弗 
里 德里 希 。 高 斯 (Carl Friedrich Gauss) 这 一 对 正 态 分 布 有 着 重要 贡献 的 数学 家 
命名 的 。 





3.6 正 态 概率 函数 :N(0, 1). N(5, 1) 和 N(10, 9) 
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单位 正 态 分 布 (或 者 标准 正 态 分 布 ) 的 随机 变量 Z~ NCO, 1) 的 密度 函数 在 
统计 上 有 着 非常 重要 的 用 途 ,其 表达 式 为 : 


1 
—exp(— 27/2) (一 ce 到: co) 
ae > z< 


该 分 布 的 累积 分 布 函数 B(z) 如 图 3. 7 所 示 。 任 意 正 态 分 布 随机 变量 X~ 
NC, 到 ) 都 可 以 转化 为 标准 形式 [37] ; 


D(z) = 





XH 


Oo 


KA= 





-一 一 一 一 一 一 一 一 二 





| 
ww 

| 
N 

| 
点 
= 
= 
w 
w 


图 3.7 单位 正 态 分 布 的 累积 分 布 函数 O(z) 


卡 方 分 布 


如 果 Zis Zz, ts Z, 为 独立 的 标准 正 态 分 布 随机 变量 ,那么 ， 
二 有 十 有 B 十 十 和 2 
其 遵循 一 个 含有 ?个 自由 度 的 卡 方 分 布 , 简 写 为 x+。 卡 方 随机 变量 的 概率 密度 
函数 为 : 
1 


wi 


pla?) 一 





(Tz ) "exp(— 7x/2) Ca? 0) 


其 中 ,T(，。) 是 一 个 7 分布 函数 ， 
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TW) 三 Forn dz (通用 参数 vy 二 0) [3.8] 
0 


它 是 连续 阶乘 函数 的 一 般 形式 。 特 别 是 当 u 等 于 一 个 非 负 整数 时 , v! = P+, 
RITE: 
(号 一 1)! (为 偶数 ) 


(4 —1)(4—-2)--(4)($ vx (n 为 奇数 ) 


卡 方 随 机 变量 的 期 望 值 和 方差 分 别 为 EX) = n Fl V(X") = 2n。 图 3.8 
列 出 了 一 些 卡 方 分 布 。 如 图 所 示 , 卡 方 分 布 是 正 偏 的 ,但 是 随 着 自由 度 的 增加 ， 
该 分 布 变 得 越 来 越 对 称 , 即 趋 近 正 态 分 布 。 

WRX), Xp.) X DHA BER n, m, e, m 的 卡 方 随机 变量 , 那 
A XSEX 十 Xi 十 … 十 X; 遵循 自由 度 为 n 二 ni 十 nz +e tm 的 卡 方 分 布 。 





图 3.8 FARER., X M X 


学 生 上 分布 
如 果 2 遵循 标准 正 态 分 布 , 且 X 遵循 个 自由 度 的 卡 方 分 布 ,那么 ， 
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这 就 是 一 个 有 nn 个 自由 度 的 学 生 t 随机 变量 ,简写 为 .35 其 概率 密度 函数 为 : 


Fl 
EE. 1 


x 2 
vant (4) ite) 





r( 





p@ = amz Co eee co) [3.9] 
ZARE t=0 SHOR, AE EG) = 0. CIRT UER, MEER n> 2, 
Via) =n/(n—2), 因此 ,对 于 自由 度 为 n 的 分 布 ,t 的 方差 比较 大 , 随 着 ”的 增 
加 ,方差 越 来 越 趋 近 1。 


P(t) 
0.5 





to=N (0,1) 





图 3.9 1 密度 函数 :t,、 ts Rt. = N(0, 1) 


图 3. 9 描述 了 一 些 t 分 布 图 形 。 当 自由 度 增 加 时 ,t 分 布 越 来 越 趋 近 标准 正 
态 分 布 ,直到 ,二 NCO, 1). 4n> 30M 分布 的 方差 就 趋 近 于 1, 上 分 布 也 就 
可 以 近似 看 做 标准 正 态 分 布 。 

学 生 t 分 布 以 20 世纪 英国 都 柏林 吉 尼 斯 啤酒 三 的 一 名 统计 学 家 威廉 。 西 
F| e RÆ William Sealy Gossett) 命 名 。 戈 塞 特 曾 以 “学生 ” 为 笔名 在 4 生物 计 
量 学 ) 杂 志 上 发 表 了 论文 4 平均 数 的 规律 误差 》。 这 篇 论文 开创 了 小 样本 统计 理 
论 的 先河 。 学 生 z 分布 对 小 样本 统计 推理 的 发 展 起 到 了 举足轻重 的 作用 。 


下 分 布 


S Xi 和 Xi 分 别 代表 自由 度 为 入 的 卡 方 随机 变量 。 那 么 ， 
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Xi/n 


F= 
Xz /nz 


它 遵循 自由 度 为 nt 和 ns 的 下 分 布 ,简写 为 F,,, 。 下 分 布 是 美国 统计 学 家 乔 
治 ，W. 斯 内 德 克 (Geroge W. Snedecor) 为 奖励 其 发 现 者 一 一 伟大 的 英国 统计 
学 家 R. A. 费 希 尔 狠 士 (Sir R. A. Fisher) 而 命名 的 。 





下 分 布 的 概率 密度 为 : 
nnz 
he it 2 J (2 yr goer (1442p) ap 
r(z)r(z)™ 
[3.10] 


比较 方程 3. 9 和 方程 3. 10 可 以 发 现 , = Fin, 而 且 , 随 着 m ZK, F.n BR 
趋 近 于 XV, ,直到 Fn o = Xi/n。 

对 于 任意 m 之 2, 下 的 期 望 值 为 已 CF) = nz/ (ms 一 2), m 的 取 值 越 大 ,其 越 
MIF 1. MFm>4, 


272 (m +n = 2) 
nı (n =— 2)? (m — 4) 





V(F) = 


图 3. 10 描述 了 一 些 下 概率 密度 函数 。 我 们 很 容易 发 现 ,下 分 布 是 正 偏 的 。 





图 3.10 F 密度 函数 :F, wo、 Fa, 10 和 Fs, 100 


100 


| 社会 科学 中 的 数理 基础 及 应 用 


多 元 正 态 分 布 


一 个 均值 向 量 为 贱 ,正定 方差 一 协 方差 矩阵 为 互 的 多 元 正 态 分 布 随机 向 量 
x— [X » Apa tey xT 的 联合 概率 密度 可 表示 为 : 





1 1 
(x) 一 (x— 1) E(x— p) 
p (2a)? zal 2 j j l 


通常 ,我 们 将 其 简化 为 x 一 N, (wp, D). 

如 果 x 是 多 元 正 态 分 布 随 机 向 量 ,那么 其 包含 的 元 素 的 边缘 分 布 是 单 因素 正 
态 分 布 , 记 做 X.~ Nui» of) .L109j 给 定 任意 子 集 的 向 量 , 剩 下 变量 的 条 件 分 布 为 
p(xi 1%), 其 中 ,x 二 (xi，x} 也 是 正 态 分 布 的 。 那么, 如果 x 一 Nh, ED) , 则 有 : 


(mX1) (mXn)(nx1) 


秩 为 rank(A) = 二 mm 过 的 随机 向 量 x 的 线性 变换 ,那么 y~N,, (Ap, ADA’). 。 如 
果 随 机 向 量 x 的 协 方差 矩阵 DAT AY AE x 的 极 大 线性 无 关子 集 为 多 元 正 
态 分 布 ,那么 ,我 们 就 说 随机 向 量 x 遵循 奇异 正 态 分 布 。 

HŽ m = 55 w = 6s of = 1.5, 0 一 2, os 一 0.5( 如 co 二 (0.5)(1.5)(3) 
= 2.25) 的 二 元 正 态 密度 函数 请 见 图 3. 11. 








A 


N 
RS 
RS 





注 : 其 中 ,密度 表面 的 切片 (表示 给 定 其 他 变量 的 条 件 分 布 ) 在 zx! 和 zz 方向 上 都 是 正 态 的 。 
图 3.11 pm =5, m = 6,0, = 1.5, í =2, p 二 0.5 的 二 元 正 态 密度 函数 
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指数 分 布 
指数 分 布 是 一 系列 以 4 为 主 参 数 的 连续 分 布 , 它 具有 密度 函数 : 
pla) =rO* (x [| 0) 


X 的 期 望 值 和 方差 分 别 为 E(X) = 1/4, V(X) = 1/0", K 3. 12 描绘 了 几 个 具有 
不 同 参 数 的 指数 分 布 。 指 数 分 布 具 有 高 度 的 正 偏 性 ,因此 , 当 事 件 出 现 的 “ 风 
险 ” 在 观测 期 中 是 一 个 常数 时 , 它 常 被 用 于 时 间 到 事件 数据 的 建 模 。 





图 3.12 关于 不 同 参数 4 的 指数 分 布 


逆 高 斯 分 布 


逆 高 斯 分 布 是 关于 两 个 系数 w 和 4 的 连续 分 布 , 它 具 有 密度 函数 : 


[a Apy)? 
pix) = zexp| 2 | (x > 0) 


X 的 期 望 值 和 方差 分 别 为 E(X) = u, V(X) = yas/4。 图 3. 13 HA LAER 
斯 分 布 。 逆 高 斯 分 布 的 方差 随 着 其 均值 的 增 大 而 增 大 ; 偏 度 随 着 y 的 增 大 而 增 
大 , 随 着 4 的 增 大 而 减 小 。 

逆 高 斯 矩阵 和 伽 马 分 布 ( 下 面 即将 介绍 ) 常 用 来 对 非 负 连 续 数据 建 模 。 
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P (2) 














X 
图 3. 13 “关于 不 同 参数 1 Ny 的 逆 高 斯 分 布 
WBRA 


伽 马 分 布 属 于 连续 分 布 , 它 是 具有 尺度 参数 w > 0 和 形状 参数 V > 0 的 概 
率 密度 函数 ， 
wi exp(—*) 
aa) ae te 
其 中 ,PR(。) 为 伽 马 函 数 ( 见 方程 3. 8)。 伽 马 分 布 的 期 望 值 和 方差 分 别 为 
E(X) =o, V(X) 二 wT 图 3.14 描述 了 在 尺度 w= 二 1 下 ,不 同形 状 参数 亚 的 
件 马 分 布 (改变 尺度 参数 仅 会 使 图 像 在 水 平 轴 上 平移 )。 


P(x) 
1:5 





0.5 














X 
3.14 不 同形 状 参 数 更 的 伽 马 分 布 (@ = 1) 
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如 果 Xi, Xs，…，X 是 具有 相同 尺度 参数 AABCRKEMW , Ws os 
P 的 独立 伽 马 随机 变量 ,那么 X= Xi 十 Xi 十 … 十 Xi 为 具有 尺度 参数 w AE 
RAA E = p 十 亚 +e +H, 的 伽 马 分 布 。 

含有 nn 个 自由 度 的 卡 方 分 布 和 具有 尺度 参数 w = 2 及 形状 参数 Y= n/2 的 
件 马 分 布 是 相等 的 。 主 参数 为 4 的 指数 分 布 和 具有 尺度 参数 w = 1/4 及 形状 参 
Bw = 1 的 伽 马 分 布 是 相等 的 。 


贝塔 分 布 
贝塔 分 布 是 包含 两 个 形状 参数 > 0, 8 二 0 的 连续 分 布 , 它 具 有 密度 函数 : 


oa 一 | == 1 
geet B= ged 











Bla, P) 
TOTA 
其 中 ,BCa, D= epy 为 贝塔 函数 。 贝 塔 分 布 的 期 望 值 和 方差 分 别 为 
E(X) Sa/e tD., VO = af 因此 ,期 望 值 取决 于 参数 w、8 


(a+ p)(at+B+1)° 
的 相对 大 小 。 如 当 a = pit, ECX) = 0.5. Aste ERS AHA E 
X a = B 时 ,分 布 是 对 称 的 。 方 差 随 a、B 的 增 大 而 减 小。 图 3. 15 描绘 了 几 个 贝 
塔 分 布 。 很 明显 ,贝塔 分 布 的 变化 很 灵活 。 


P(x) 





ET 0.2 04 06 08 1.0 0.0 0.2 04 0E OS 1.0 
(a) , (b) | 
注 :在 图 3. 15(a) 中 ,很 明显 , 当 a = B= 1 时 ,贝塔 分 布 退化 为 矩 分 布 。 图 3. 15(a) 描 绘 了 对 称 的 贝塔 
分 布 ,图 3. 15(b) 描 绘 了 反对 称 的 贝塔 分 布 。 
3.15 Aa, PASH NED 
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渐 近 分 布 理 论 : 初步 介绍 


有 时 ,因为 很 难 确 定 统计 变量 的 小 样本 性 质 ,所 以 研究 一 个 变量 随 着 样本 
增 大 的 表现 就 变 得 尤为 重要 。 渐 近 分 布 理论 就 为 这 类 研究 提供 了 工具 。 在 本 
章节 ,我 仅 对 该 理论 进行 概述 ,更 完整 的 叙述 可 参考 其 他 相关 书籍 。 


极限 概率 


渐 近 分 布 理 论 常 被 应 用 于 随机 变量 序列 中 。 但 是 ,我 们 有 必要 先 考虑 非 随 
机 无 限 序列 {a1， as,，…，a,，…)。 关 于 “ 非 随 机 ”, 我 指 的 是 每 一 个 ww 而 非 随机 
变量 是 固定 的 。 读 者 可 能 会 注意 到 ,如 果 对 于 任意 无 限 小 的 数 s, 总 是 存在 一 个 
IER nC) X FREH n>n), H | a 一 a |<e, 那么 我 们 称 该 数列 存在 极限 
a。 换 句 话 说 ,只 要 nn 足够 大 ,a, 就 可 以 任意 地 接近 4a。n(e) 强 调 了 nn 值 取决 于 
我 们 所 选择 的 标准 s( 请 参见 前 文 有 关 函 数 极限 的 定义 )。 为 了 使 表述 更 简洁 ， 
我 们 可 以 用 表达 式 lima, = a, 例如 ,车 a = 1+1/n, AKA lima, = 1, Al 3. 16 
描绘 了 该 数列 及 其 极限 。 





图 3.16 具有 极限 a = 1 的 序列 a, = 1 十 1/n 的 前 20 个 值 


我 们 现在 考虑 随机 变量 序列 {Xl， X2, ai Krn see} 在 应 用 统计 中 ,X 为 
估计 量 ,n 为 该 估计 量 的 样本 大 小 。 让 pa =Pr(| X, 一 a | 二 0), 其 中 4 是 一 个 常 
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数 ,3 是 一 个 很 小 的 整数 。 我 们 可 以 把 p 想象 成 X, 逐渐 接近 a 的 概率 。 假 设 
非 随机 概率 序列 {1 ，ps，…，p。，…} 以 1 为 极限 [9 , 即 lim Pr(| X, 一 a |< 
6) = 1。 那么 随 着 n 的 增 大 ,随机 变量 X, 将 在 a 的 小 范围 区 域内 更 接近 4, 图 
3.17 描 述 了 此 情形 。 如 果 无 论 6 多么 小 ,该 结果 都 成 立 ,那么 我 们 说 a 是 X, 的 概 
率 极限 ,表示 为 plim X, = a, 为 方便 起 见 , 我 们 可 以 把 去掉 , 记 作 plim X = a. 





注 : 随 着 的 增 大 ,X, 将 越 来 越 接近 a。 
图 3.17 plimX, =a 
概率 极限 具有 如 下 重要 性 质 : 假 如 plimXX 二 a, 且 Y= fX) WX 的 连续 函 
数 ,那么 , plimY = f(a). F, WÈ plim X =a, plimY =b, Z= f(X, YW 
X 和 YY 的 连续 函数 ,那么 Z= fla, b). 


渐 近 期 望 均值 和 方差 


回 到 随机 变量 序列 {Xi ，Xs vets Xa ee} ,并 令 jy AX, 的 期 望 值 。 那 么 ， 
{ps Am，…，m，…} 为 一 个 非 随 机 序列 。 如 果 该 序列 趋 近 于 一 个 极限 ,那么 
我 们 说 jy 为 X 的 渐 近 期 望 值 , 记 做 se(X)。 

尽管 我 们 会 很 自然 地 把 渐 近 方差 的 定义 序列 与 方差 的 极限 进行 类 比 ,但 是 
该 定义 无 法 让 人 满意 ,因为 在 许多 情况 下 (下 面 将 举例 说 明 ), lim V(X,) = 0。 
假设 我 们 计算 一 个 从 均值 为 4 方差 为 a 的 总 体 中 抽取 的 (大 小 为 n) 样 本 均值 ， 
将 其 记 做 X,。 由 初等 统计 学 可 知 , E(X,) = ps 另外 ， 


Se = 2 
V(X.) = EL(X, —p)?] = = 
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因此 , limV(X,) = 0, 把 /n 加 入 中 括号 内 ,有 E{ [Vn CX, — wd |?) = 0° HRR 
以 然后 取 极 限 即 可 得 到 我 们 想 要 的 结果 ,此 时 样本 均值 的 渐 近 方差 为 : 


v(X) = lim ŽE (Vn X, — WF} 
= Te{[Va(X, 一 办 也) 


Oo 
n 





该 结果 没有 什么 特别 之 处 ,因为 V(X) 二 vu(X) ,事实 上 ,这 与 一 开始 给 出 的 渐 近 
方差 的 定义 是 等 价 的 。 在 实际 应 用 中 , 当 有 限 样本 方差 不 可 求 时 ,还 是 有 可 能 
找到 渐 近 方差 的 。 此 时 ,我 们 可 以 将 渐 近 结果 当做 大 样本 的 近似 。 
通常 ,如 果 X, 的 期 望 值 为 ,那么 ,X 的 渐 近 方差 定义 为 [42] , 
W(X) = He { [acX, —p)]) [3. 11] 


渐 近 分 布 


让 {P,P;,…，P,,，…}) 代 表 随机 变量 序列 {X! ，X: ，…，X,，…} 的 累积 
分 布 函数 。 假 如 对 于 随机 变量 的 所 有 值 x 和 任意 无 论 多 小 的 数 e ,我们 总 能 找 
到 一 个 足够 大 的 数 n(e) ,那么 ,对 于 所 有 的 nn 二 nle), ABA | P,(zx) 一 P(x) |< 
es 那么 ,我 们 说 X 的 累积 分 布 函 数 收敛 于 渐 近 分 布 P。 

中 心 极限 定理 描述 了 一 组 独立 同 分 布 , 且 具 有 有 限 的 期 望 值 和 方差 的 随机 
变量 的 均值 遵循 近似 正 态 分 布 ,该 近似 过 程 随 着 随机 变量 数目 的 增加 而 加 强 。 
例如 ,有 一 个 样本 大 小 为 n、 主 参数 为 4, 且 高 度 偏 斜 的 指数 分 布 ,其 均值 wk 和 方 
Ho 都 为 1。 我 们 知道 ,指数 分 布 是 伽 马 分 布 的 一 个 特例 ,其 形状 参数 亚 = 1, 
REBM wo = 1/4, 那么 ,样本 的 和 >)” Xi;( 即 nX) PIERS W = n, RIES 
Ho 二 1 的 伽 马 分 布 。 图 3. 18 描绘 了 从 指数 分 布 总 体 得 到 的 样本 均值 X 的 抽 
样 分 布 密度 函数 随 样本 量 大 小 的 变化 , 且 每 一 种 情况 都 比较 了 X 的 真实 伽 马 样 
本 分 布 与 近似 正 态 分 布 N(1, 1/n), 正 态 近 似 随 样本 量 的 增加 而 傅 发 精确 (而 X 
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的 抽样 分 布 的 方差 随 之 减 小 ) 。 


(b) 2 一 2 


(a)n=] 





P(X) 











P(X) (c)n=5 P(X) (d)n=25 
1.0 Pee 
0.8 
1.5 
0.6 
1.0 
0.4 
Py 0.5 
0 0.0 
-2 0 2 4 6 -2 0 2 4 6 
X X 


注 : 图 3. 18a), n= 1 HEXA X 的 总 体 分 布 。 在 每 一 张 图 中 , 实 线 为 真实 ( 伽 马 ) 抽 样 分 布 X 的 密度 
函数 ,虚线 为 正 态 近 似 NCL, 1/n) 的 密度 函数 。 
图 3.18 中心 极 限定 理 : 从 指数 分 布 总 体 ( 主 参数 为 1 = 1 ) 得 到 的 (样本 量 n 的 大 小 不 同 ) 
样本 均值 X 的 抽样 分 布 


随机 向 量 与 随机 矩 阵 


我 们 将 以 上 结果 扩展 到 向 量 和 甜 阵 中 ,得 到 : 当 plim X; =a G= 1, 2, +++, m) 
,一 as Plim X = ,全 ,意味 着 ,对 于 所 有 的 i 和 j，, plimXy 一 ay。 随 
机 向 量 x 的 近似 期 望 值 定义 为 由 其 中 元 素 的 近似 期 望 值 组 成 的 向 量 , 即 p = 
e(x) 三 [e(X1), e(X;),…, Xn) T o xX 的 渐 近 方差 一 协 方差 矩阵 定义 为 : 


时 , plim x 
(mX1 


1 / 
u(x) = ve { [Vn —p) vn, — 1} 
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统计 估计 量 的 属性 [2 


一 个 样本 统计 量 ( 即 一 个 有 关 样 本 中 众多 观测 的 函数 ) 的 估计 量 是 用 来 估 
计 总 体 参数 的 。 由 于 其 数值 因 样 本 不 同 而 异 ,因此 估计 量 是 一 个 随机 变量 。 信 
计 是 特定 样本 估计 量 的 数值 。 估 计量 的 概率 分 布 称 为 “抽样 分 布 ”该 分 布 所 对 
应 的 方差 称 为 估计 量 的 “抽样 方差 ”。 


偏差 


WR ECA) =a, 那么 我 们 说 参数 a 的 估计 量 A 是 无 偏 的 。 因 此 , E(A) 一 a 
即 A 的 偏差 。 

假设 我 们 从 均值 为 /方差 为 a 的 总 体 中 得 到 个 观测 X, ,那么 ,我 们 说 样 
KHE X = > Xi /n 是 j 的 无 偏 估计 量 ,同时 ， 
四 


n 


g 





[3:12] 


S Ee 的 有 偏 估计 量 , 因 为 ES.) = [Ca a], S 的 偏差 因此 等 于 
一 2 /n。 有 关 抽 样 分 布 的 无 偏 及 有 偏 估计 量 ,请 见 图 3. 19。 


P (a) 






ACE) 


图 3. 19 AA E(A) =a AeA 是 wx 的 无 偏 估计 量 ; 
AA E(A,) >a, 因此 估计 量 A, 是 正 偏 的 
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渐 近 偏差 
参数 a 的 估计 量 A 的 渐 近 偏差 是 (A) 一 a, 那么 ,如 果 s(4A) =a, 则 估计 量 
A 是 无 偏 的 。 由 于 当 not, — o /n—> 0, 因此 Ss 是 渐 近 无 偏 的 。 


均 方 误差 与 有 效 性 


一 个 估计 量 是 无 偏 的 意味 着 ,其 重复 样本 的 平均 数值 和 总 体 估 计 参 数 相 
同 。 很 明显 ,该 特征 应 该 是 估计 量 最 理想 的 性 质 。 但 是 ,如 果 样 本 估计 量 和 总 
体 估计 参数 不 接近 的 话 ,那么 该 估计 量 则 是 无 用 的 。 对 于 期 望 值 ,一 些 样 本 的 
较 大 的 负 估 计 误 差 可 以 抵消 其 他 样本 的 较 大 的 正 估计 误差 。 
参数 a 的 估计 量 的 均 方 误差 (MSE) 是 估计 量 与 参数 之 间 的 差异 平方 的 均 
值 , 即 MSE(A) = EL(A 一 a)*]。 估 计量 的 有 效 性 与 其 均 方 误差 成 反比 。 通 常 ， 
我 们 比较 倾向 于 有 效 的 估计 量 。 
HF ECA) = a, 因此 ,一 个 无 偏 估计 量 的 均 方 误差 ,简单 地 说 ,就 是 其 抽样 
方差 。 而 对 于 一 个 有 偏 估计 量 ， 
MES(A) = E[(A—a)? ] = E{[A— E(A) + E(A) —a]’} 
= E{[A— E(A)}?} HEA) — a} + 2LE(A) — E(A) [ECA — a] 
= V(A) + [bias (A) ]’ +0 
当 一 个 估计 量 的 有 效 性 增加 时 ,其 抽样 方差 及 偏差 会 减 小 。 那 么 ,比较 两 个 估 
计量 ,抽样 方差 上 的 优势 可 以 更 多 地 补偿 其 偏差 劣势 ,如 图 3. 20 所 示 。 


P (a) | 


1 A, (Abi, ARO 








AEN, EXO : 








注 :尽管 估计 量 A, 是 有 偏 的 ,但 是 A: 相对 于 无 偏 估计 量 A, ,是 参数 a 的 一 个 更 有 效 的 估计 量 ,原因 在 
F.A: 的 小 方差 性 可 以 部 分 补偿 其 偏差 性 。 
图 3.20 估计 量 的 相对 有 效 性 
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渐 近 有 效 性 
渐 近 有 效 性 与 渐 近 均 方 误差 (AMSE) 成 反比 , 且 渐 近 均 方 误差 是 渐 近 方差 
和 渐 近 偏差 平方 的 和 。 


一 致 性 


如 果 plimA = a, 那么 参数 a 的 估计 量 A 是 一 致 的 。 一 致 性 的 充分 ( 非 必 
要 ) 条 件 是 估计 量 本 身 是 渐 近 无 偏 的 , 且 抽 样 方差 随 着 ”的 增加 趋 近 于 0。 该 条 
件 暗示 了 估计 量 的 均 方 误差 的 极限 为 0。 图 3. 17 描述 了 a 的 估计 量 X 的 一 致 
性 。 方程 3. 12 表示 ,估计 量 Si 是 总 体 方差 的 一 致 佑 计量, 尽管 在 有 限 样本 
中 , 它 本 身 存 在 偏差 。 


充分 性 


充分 性 的 概念 比 无 偏 . 有 效 及 一 致 更 抽象 :如 果 在 样本 中 ,统计 量 详尽 地 表 
达 了 参数 的 所 有 信息 ,那么 ,基于 观测 值 的 统计 量 S 符合 充分 性 条 件 ,或 者 可 
以 说 ,假设 观测 值 X, ，X: ，…， X, 是 从 以 为 参数 的 概率 分 布 中 得 来 的 。 我 们 
让 统计 量 S -7CX ，X:，…，X,)， 如果 观测 值 的 概率 分 布 是 以 S 的 数值 为 条 
件 的 ,也 就 是 说 pris zs，…， x, | S = 9) 与 a 无 关 , 那 么 S 即 一 个 a 的 充分 统 
计量 。 注 意 ,充分 统计 量 S 不 是 参数 a 的 估计 量 。 

要 描述 充分 性 ,我 们 可 以 假设 ”个 观测 都 是 独立 采样 得 来 的 ,对 于 每 个 观 
测 ,X 为 1 的 概率 为 r, 为 0 的 概率 为 1 一 r。 即 ,X 是 独立 同 分 布 的 伯 努 利 随机 
变量 。 在 这 里 ,我 会 证 明 样本 总 和 S= J)" X 是 的 充分 统计 量 。 如 果 我 们 
已 知 S 的 值 , 则 对 于 S 的 不 同 种 组 合 (s 一 0; s 一 1) ,数目 为 (”), 且 每 种 组 合 
的 可 能 性 为 1/ (”) .我 们 知道 ,随机 变量 S 遵循 一 个 二 项 分 布 ,由 于 其 概率 与 x 
无 关 ,因此 ,统计 量 S 是 x 的 充分 统计 量 。 同 理 ,样本 比例 了 三 S/n 也 是 一 个 充 
分 统计 量 。 样 本 比例 P( 而 不 是 总 和 S) 是 x 的 估计 量 。 

充分 性 的 概率 可 以 延伸 到 一 组 参数 和 统计 量 上 :已 知 一 个 样本 (可 能 为 多 元 ) 
中 的 观测 为 %， xes ts x,, 如 果 观 测 的 条 件 分 布 决定 了 s 与 a 无关, 那么 ,向 量 统 
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tht s=(S,, So, Sp 三 fun, mo. &) 是 参数 @== [a ,ow,…, a] WK 
合 充分 统计 量 。 例 如 ,独立 随机 变量 的 均值 X 和 S 分 别 是 正 态 分 布 参 数 y. 和 
的 联合 充分 统计 量 ( 因 为 样本 总 和 》) X 与 平方 和 DX? 所 包含 的 信息 与 X AS? 
相同 )。 如 果 没 有 更 小 的 充分 统计 量 组 ,那么 该 组 充分 统计 量 则 是 最 低 充分 统计 
量 组 。 


稳健 性 


当 一 个 估计 量 的 有 效 性 (及 其 相对 其 他 估计 量 的 有 效 性 ) 不 极 大 地 依赖 于 
数据 分 布 ,那么 我 们 说 该 估计 量 是 稳健 的 。 

还 有 另 一 种 稳健 性 , 称 为 “ 效 度 稳健 性 ”, 我 们 要 将 它 与 有 效 稳健 性 相 区 分 。 
对 于 统计 推理 过 程 , 如 果 其 效 度 不 极 大 地 依赖 于 数据 分 布 ,那么 ,我 们 说 它 是 稳 
健 的 。 因 此 ,即使 检验 违反 了 分 布 假设 (如 正 态 分 布 假设 ) ,稳健 性 假设 检验 的 p 
值 仍 可 看 做 是 近似 准确 的 。 同 样 , 如 果 置 信 区 间 的 覆盖 率 与 之 前 所 陈述 的 相同 
(例如 ,一 个 95% 置 信 区 间 覆 盖 了 差不多 95% 的 样本 ) ,即使 有 时 会 违反 分 布 候 
设 , 但 我 们 仍 说 该 置信 区 间 是 稳健 的 。 当 一 个 检验 或 者 置信 区 间 是 基于 一 个 无 
效 估计 量 的 ,如 果 检 验 的 统计 功效 很 低 ,或 者 置信 区 间 很 宽 ,那么 ,该 检验 或 者 
置信 区 间 的 效 度 稳健 性 就 很 低 。 

要 具体 描述 有 效 稳健 性 ,我 们 就 要 把 重点 放 在 估计 一 个 对 称 分 布 的 中 心 y 
上 。[4 纠 只 要 XX 存在 有 限 方差 o? ,那么 ,样本 均值 X 的 方差 为 V(X) = 0? /n, 这 里 
的 是 样本 量 ( 与 基本 统计 的 结果 一 致 ), 且 样本 中 位 数 的 方差 与 X 的 分 布 有 关 : 


V(median) ~ 


1 
4n plas) |? 
HP, plos) JI X 为 总 体 中 位 数 时 的 密度 。 

运用 到 正 态 分 布 的 总 体 上 则 有 X 一 NG 0 ) ,中 位 数 方差 为 V(median) = 
mo” /2n 因此 ,样本 均值 相对 于 中 位 数 是 一 个 相对 有 效 的 统计 量 : 


Vimedian) jw’/2n 元 
= = "5 =— 1.57 
V(X) a’ /7 2 
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为 了 保证 准确 性 ,用 样本 中 位 数 来 估计 y 所 用 的 样本 量 是 用 样本 均值 进行 估计 
时 的 1.57 倍 。 

相反 ,假设 X 服从 自由 度 为 3 的 1 分 布 ,该 分 布 相对 于 正 态 分 布 ,尾部 较 重 
HRK. BBA. e = 3/(3 一 2) =3, pa = p0) = 0.3675, 因此 ， 


vX) = 2 
n 


1 — 1.851 
4n(0. 36757) n 





V(median) = 


对 于 此 例 , 均 值 只 有 1. 851/3 = 0. 617(62%)。 因 此 ,在 这 里 ,均值 与 中 位 数 一 样 有 效 。 
稳健 性 对 于 异常 数据 具有 耐 抗 性 ,一 个 耐 抗 估 计量 不 会 被 小 部 分 的 异常 数 
据 所 影响 。 均 值 对 异常 值 的 耐 抗 性 比较 小 ,这 点 很 容易 证 明 :从 一 个 标准 正 态 
分 布 中 抽取 一 个 含有 6 个 观测 的 样本 ,如 下 所 示 : 
Xi =—0.068 X,=—1.282 X;=0.013 
X, = 0,141 X; =— 0.980 X, =1.263 [3. 13] 


这 些 值 的 均值 为 X = 一 0.152。 如 果 我 们 想 加 入 第 七 个 观测 , 即 X;, 它 可 取 从 
一 10 到 十 10( 或 者 范围 更 广 一 些 ,例如 ,从 一 2 到 十 co) 的 一 切 可 能 数值 。 该 结 
果 称 为 均值 的 “影响 函数 ”, 如 图 3. 21(a) 所 示 。 很 明显 , 随 着 X 的 取 值 趋向 于 
极 值 ,样本 均值 也 不 断 增 大 。 


X median (X) 
As 0. 00 
0.5 
a6 —0. 02 
—0.5 —0. 04 
一 1.0 
—0. 06 
一 1.5 
一 10 —5 0 5 10 一 10 —5 0 5 10 
X， X, 


(a) (b) 
注 : 中 位 数 对 函数 的 影响 是 有 界 的 ,但 均值 却 不 是 。 注 意 两 张 图 纵 坐 标的 刻度 不 同 。 
图 3.21 样本 均值 (a) 和 中 位 数 (b) 的 影响 函数 X =— 0.068, X, =— 1. 282, 
X; = 0.013, X, = 0. 141，Xs =— 0. 980, X, = 1. 263 
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与 估计 耐 抗 性 相关 的 一 个 概念 称 为 估计 值 的 “ 崩 演 点 ”。 崩 演 点 是 估计 值 
可 以 耐 受 而 不 会 被 任意 异常 大 的 值 所 影响 的 “ 坏 ” 数 据 部 分 。 均 值 的 出演 点 是 
0, 因 为 正如 我 们 所 看 到 的 ,一 个 不 好 的 观测 可 以 任意 地 改变 均值 的 大 小 。 相 
反 , 中 位 数 的 崩溃 点 为 50%, 原 因 在 于 ,即使 有 一 半 的 数据 是 “ 坏 ” 的 ,中 位 数 也 
不 会 被 完全 影响 。 

M 估计 

用 均值 将 最 小 二 乘 目标 函数 最 小 化 后 得 到 : 


py = DXA) 
该 均值 影响 函数 的 形状 为 目标 函数 对 残 差 玉 圭 X 一 从 求 导 的 结果 : 
ps (E) = pis (E) = 2E 


KARAEHE RER. 那么 ,将 最 小 二 乘 目 标 函 数 重新 定义 为 ps(E) = 
SE! 会 更 加 方便 ,这 样 的 话 , ys(E) = E 

现在 考虑 样本 中 位 数 是 y 的 估计 值 的 情况 。 中 位 数 最 小 化 了 最 小 绝对 什 
(LAV) 的 目标 函数 : 


Daw Ed = DeX, —fy=>} | X; 一 丛 | 
i=l 


结果 我 们 发 现 , 中 位 数 对 异常 值 的 耐 抗 性 比 均值 强 得 多 。 有 关中 位 数 的 影响 函 
数 请 参见 图 3. 21(b) 。 与 均值 相反 ,中 位 数 在 观测 差异 上 的 影响 是 有 界 的 。 之 
前 提 到 过 , 目标 函数 的 导数 决定 了 影响 函数 的 形状 [45] ; 


1 (E> 0) 
dav (E) = pv = 0 (E = 0) 
=] @<0) 


尽管 中 位 数 对 异常 值 的 耐 抗 性 比 均值 更 强 , 但 是 ,如 果 X 为 正 态 分 布 ,中 位 
数 就 不 如 均值 有 效 。 因 为 其 他 目标 函数 与 对 异常 值 的 耐 抗 性 加 在 一 起 ,其 有 效 


稳健 性 就 大 大 提高 了 。 我 们 将 可 以 最 小 化 目标 函数 DED 的 估计 值 称 为 
“M 估计 量 ” .[46] 
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两 个 常见 的 M 估计 量 是 Huber 估计 量 和 双 权 或 者 双 平 方 估计 量 。Huber 
估计 量 是 以 发 现 M 估计 量 的 彼得 … J. AAR (Peter J. Huber) ar As LAN 
计 是 由 约翰 W. 杜 克 (John W. Tukey) 一 一 一 个 为 统计 学 作出 了 重大 贡献 (其 
中 包括 稳健 估计 ) 的 著名 美国 统计 学 家 发 明 的 。 

Huber 估计 量 是 最 小 二 乘 与 最 小 绝对 值 之 间 的 权衡 ,其 数据 的 中 心 靠近 最 
小 二 乘 ,而 尾部 与 最 小 绝对 值 相似 。 





SE (| E|<&) 


pu (Ð) = 
A E|- (E|>k) 


图 3. 22 描述 了 Huber 目标 函数 on on KSB I RR pu 471 


(a) (b) 
注 :要 校准 这 两 张 图 , 细 调 常数 需 设置 为 k= 二 1 (请 见 文 中 有 关 细 调 常数 的 讨论 ) 。 
图 3.22 Huber 目标 函数 pu(a) 和 影响 函数 wa(b) 


k CE Sk) 
Tar (| EI<k) 
—k (EQ<—&k) 
在 这 里 ,定义 分 布 中 心 及 尾部 的 k 值 称 为 “ 细 调 常数 ”。 我 们 常常 把 细 调 常数 表 


达成 多 尺度 变量 X( 如 展 宽 ), 即 取 & = cS, 其 中 ,S 是 尺度 的 量度 。 样 本 标准 差 
是 一 个 不 太 好 的 尺度 量度 ,因为 它 被 异常 值 影 响 的 程度 比 均值 大 。 常 见 的 尺度 
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稳健 量度 是 中 位 数 绝对 偏差 (MAD) : 
MAD = median| X; = | 


最 初 ,我 们 用 变量 X 的 中 位 数 作为 人 估计 ,然后 我 们 定义 SS MAD/0. 6745, 其 
保证 了 当 总 体 分 布 为 正 态 分 布 时 ,S 是 标准 差 o 的 估计 。 用 & = 1.345S( 如 
1. 345/0. 6745 = 2MADs) , 相对 于 样本 均值 ,在 总 体 为 正 态 分 布 时 ,加 上 总 体 为 
非 正 态 分 布 时 其 对 异常 值 所 产生 的 相当 的 耐 抗 性 的 情况 下 , 它 可 以 产生 95% 的 
有 效 性 。 一 个 细 调 常数 越 小 ,其 产生 的 耐 抗 性 越 大 。 

双 权 目标 函数 达到 平衡 或 者 说 变 平 后 的 残 差 非常 大 [48] : 


Elfi- T} aeo 


k? 
6 CIE Ik) 


因此 , 双 权 估 计量 的 影响 函数 可 以 再 降 到 0, 从 而 完全 地 扣除 充分 异常 情况 的 影响 : 





Paw (E) = 


min) | EIZA 


0 Q E|>k) 


图 3. 23 描述 了 有 关 pow 和 yew 的 函数 。 在 样本 正 态 分 布 时 ,用 二 4. 685S( 如 
4. 685/0. 6745<z7MADs) 可 以 产生 95% 的 有 效 性 。 

















Yow (E) 
Pay (E) "0.3 
sL 
0.15 0.2 
0.1 
0.10 
0.0 
0. 05+ 一 0.1 
一 0.2 
0. 00k: i | 1 zi 一 0.3 
一 2 ”一 1 0 1 2 一 2 ~=] 0 1 2 
E E 


(a) (b) 
TE: BoBC HE AE RIE ADE Bors BLE Nk = 1。 当 |E| 很 大 时 ,影响 函数 “ 降 ” 为 0。 
图 3.23 双 权 目标 函数 poy (a) 和 “影响 函数 ”yew (b) 
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当 MAD 用 于 估计 尺度 时 , Huber 和 双 权 估计 值 均 可 实现 裔 演 点 为 50%。 

计算 M 估计 值 通常 需要 用 到 迭代 (尽管 对 于 均值 和 中 位 数 ,和 迭代 并 不 是 必 
须 的 ,然而 正如 我 们 所 见 ,其 与 M 估计 的 框架 相 适 应 )。A 的 估计 方程 式 把 目标 
函数 的 差异 设置 为 0, 因 此 有 : 


SR: —é) = 0 [3. 14] 
方程 3. 14 有 许多 解法 ,其 中 最 直接 、 最 简单 的 要 数 用 迭代 法 对 均值 再 加 权 ， 
其 过 程 为 : 
首先 ,定义 权 方 程 w(E) = y(E)/E, 那么 ,估计 方程 变 为 : 
其 中 ， 
wi = wX; — Ê) 
方程 3. 15 的 解 是 加 权 后 的 均值 ,为 : 
a ZX 
Xa 
加 权 函 数 对 应 的 最 小 二 乘 .LAV、Huber 以 及 双 权 目标 函数 请 参见 表 3. 1 和 图 


3. 24。 最 小 二 乘 权 函数 对 每 个 观测 都 加 了 权 , 同 时 , 双 权 对 充分 异常 的 数值 赋 
予 0 值 ,LAV 和 Huber 不 断 趋 近 于 0 却 无 法 达到 0。 





表 3.1 一 些 M 估 计量 的 权重 函数 





目标 函数 oE) 权重 函数 oE) 
最 小 二 乘 1 
最 小 绝对 值 1/|E| (E40) 
Huber 1 (E<k) 
k/|E| (Œ >k) 
双 权 [i- (EY faro 


0 (E> k) 
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RUKEA 的 初始 估计 ,如 XX DE He. FH A HERE SO 
初始 估计 和 初始 权重 wo" 一 w(X — 2), Flint BERBER THAT = 0。 尺 
度 所 需 的 细 调 常数 为 = cS (之 前 已 经 指定 过 c)。 

EFEMERA LHA AO = Dol X,/ Dol”. YA 
代 到 另 一 个 迭代 的 从 w 可 忽略 不 计时 ,计算 停止。 


wris(E) 
1.0 


0.8 


0.6 


0.4 





一 和 =Z -= 0 1 2 3 


E 
Cc) 


wia (E) 
10 


8 
6 


4 


N 


=2 下 0 1 2 
E 
(d) 


注 : 对 于 Huber 和 双 权 估计 值 , 细 调 常数 设 定 为 &= 1, TERR. LAV 估计 量 的 纵 坐标 和 Huber 估计 量 的 


横 坐 标 与 其 他 图 不 同 。 


图 3.24 (a) 最 小 二 乘 ;(b) 最 小 绝对 值 ;(c)Huber; (d) 双 权 估 计量 的 权 函 数 o( E) 


描述 有 关 估 计量 的 应 用 ,我 们 首先 要 回顾 一 下 之 前 所 提 到 的 从 标准 正 态 分 
fi NO, 1) 得 来 的 含有 6 个 观测 值 的 样本 (请 见方 程 3. 13) ,我 们 先 在 该 样本 中 
制造 一 个 异常 值 X; = 10。 用 Huber fhi hE c= 1. 345 和 双 权 估计 量 c = 4. 685, 
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得 到 : 


X = 1. 298, median(X) = 0.013, @ = 0.201, /pw =— 0. 161 


很 明显 ,样本 均值 已 经 被 异常 值 所 影响 ,但 是 其 他 估计 量 却 没有 。 
最 大 似 然 估 计 


最 大 似 然 估计 方法 所 提供 的 估计 量 是 一 个 合理 而 直观 的 基础 , 它 同 时 含有 
众多 我 们 所 期 望 的 统计 属性 。 该 方法 应 用 广泛 且 简 单 易 行 。 再 则 ,运用 最 大 似 
然 估 计量 , 它 的 一 般 性 理论 所 提供 的 相应 的 标准 误 和 统计 检验 等 都 是 有 用 的 统 
计 推 论 。 然 而 该 方法 的 劣势 在 于 , 它 往 往 需 要 对 数据 结构 作出 较 强 的 假定 。 

似 然 函数 不 仅 在 经 典 统计 推论 中 扮演 着 至 关 重 要 的 角色 ,还 在 贝 叶 斯 推断 
中 起 着 举足轻重 的 作用 。 


一 个 例子 


让 我 们 考虑 一 个 简单 的 例子 :假设 我 们 要 估计 掷 硬币 得 到 正面 的 概率 r。 
我 们 投掷 10 次 (例如 ,我 们 取 10 次 掷 硬币 的 结果 , n = 10), 得 到 的 结果 为 : 
HHTHHHTTHH。 那么 ,得 到 这 个 结果 的 概率 是 未 知 参 数 x 的 函数 : 


Pr( 数 据 | BBO = Pr(HHTHHHTTHH | x) 
= ar (l — nm (l — r) (mn)m 
= r (l — r)’ 
对 于 10 个 独立 的 伯 努 利 随机 变量 ,得 到 该 结果 的 概率 就 是 每 次 得 到 正面 或 者 反 
面 的 概率 乘积 (如 果 得 到 的 是 正面 ,那么 , X; = 1, 反之 X; = 0, 1 一 1…10)。 
对 于 我 们 的 样本 ,其 数据 是 固定 的 ,因为 我 们 之 前 已 经 收集 好 了 。 参 数 x 也 
有 一 个 固定 值 ,但 是 这 个 值 是 未 知 的 ,因此 我 们 让 其 落 在 我 们 所 想象 的 0 到 1 的 
区 间 内 ,把 观测 到 数据 的 概率 看 做 x 的 函数 。 该 函数 为 “ 似 然 函数 ”.: 
LÆGE | 参数 ) = L(x | HHTHHHTTHH) 


=7'(1—7)' 
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概率 函数 和 似 然 函数 的 公式 相同 ,但 是 概率 函数 是 参数 固定 的 数据 函数 ,而 似 
然 函数 是 数据 固定 的 参数 函数 。 
下 表 是 一 些 具 有 代表 性 的 似 然 值 所 对 应 的 x 值 ,中 


L(x | 数据) 二 x Ad r)’ 


9 





0.0 

0. 0000000729 
0. 00000655 
0. 0000750 
0. 000354 
0. 000977 
0. 00179 

0. 00222 

0. 00168 

0. 000478 
0.0 


2 2 


es 2 S 
DOD O O N DaN S&S WM KY O 


图 3. 25 为 总 似 然 函 数 。 尽 管 每 个 L(x| 数 据 ) 的 值 都 是 一 个 概念 上 的 概率 ， 
但 是 L(x| 数 据 ) 函 数 既 不 是 一 个 概率 分 布 ,也 不 是 一 个 密度 函数 ,因为 其 总 和 并 
不 为 1。 

L (| 数据 ) 


0. 0020 
0. 0015 
0. 0010 
0. 0005 


0. 0000 





0.0 0. 2 0. 4 0.6 元 0.8 1.0 
元 


3.25 ” 似 然 函数 L(xlHHTHHHTTHH)=x (1—7)? 


对 于 此 例 , 不 论 x 的 真实 值 有 多 大 ,我 们 已 有 数据 样本 (HHTHHHTTHH) 
的 概率 很 小 。 除 非 样 本 很 小 ,否则 通常 任何 指定 的 样本 结果 (包括 我 们 已 知 的 ) 
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在 收集 数据 前 得 到 的 概率 都 是 很 小 的 。 

尽管 如 此 , 似 然 函 数 包含 了 有 关 示 知 参数 x 的 重要 信息 。 例 如 ,x 不 可 能 等 
于 0 或 者 1, 因 为 如 果 它 为 其 中 任意 一 个 值 ,那么 ,我 们 的 观测 数据 (包括 得 到 硬 
币 的 正 反面 ) 就 不 可 能 得 到 。 反 之 ,r 值 总 是 由 数据 决定 , 它 总 可 以 使 似 然 函数 
最 大 化 ,因此 该 值 称 为 “最 大 似 然 估 计 ”(MLE) , 记 做 多。 在 这 里 ,人 多 王 0.7, 即 得 
到 硬币 正面 在 样本 中 的 比例 。 

将 例子 推广 化 

更 普遍 的 情况 是 ,我 们 掷 硬币 半 次 ,那么 得 到 二 个 正面 和 一 工 个 反面 的 概 

L(x | 数据 ) = Pr( 数 据 | m) = AA r 

我 们 想得到 一 个 x, 使 L(x| 数 据 ) 最 大 。 对 于 此 例 ,还 有 一 个 更 简单 而 且 等 价 的 
方法 , 即 找到 一 个 x 值 ,使 似 然 函 数 的 对 数 最 大 化 ,这 样 ,我 们 有 : 


log. L (x) = zlog. x + (n— x)log.(l—x) [3.16] 
log. L Gr) Xt r RENE: 


dlog LG) _ x 
IT T 


- +a ot) 


对 数 似 然 函数 对 参数 求 导 后 所 得 的 函数 称 为 “记分 ”( 或 者 “记分 函数 ”)。 将 记 
分 设置 为 0 求解 ,可 以 得 到 MLE, 解 方程 后 我 们 发 现 , MLE 即 样本 比例 x/n 
(读者 可 以 自己 证 明 ) ,最 大 似 然 估 计量 是 + = X/n。 要 避免 最 后 阶段 对 估计 量 
的 替换 ,我 们 可 以 在 对 数 似 然 函 数 中 用 代替 XX( 如 方程 3. 16)。 


最 大 似 然 估计 量 


最 大 似 然 估计 量 的 性 质 如 下 : 
(1) 最 大 似 然 估 计量 是 一 致 的 。 
(2) 最 大 似 然 估计 量 是 渐 近 无 偏 的 ,尽管 在 有 限 样本 里 它 可 能 有 偏 。 
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(3) 最 大 似 然 估计 量 是 渐 近 有 效 的 一 一 渐 近 无 偏 估 计量 的 渐 近 方差 较 大 。 

(4) 最 大 似 然 估 计量 是 正 态 分 布 的 。 

(5) 如 果 一 个 参数 含有 充分 统计 量 , 那 么 ,该 参数 的 最 大 似 然 估 计量 是 其 充 
分 统计 量 的 函数 。 

(6) WR a Æ a H MLE, H p= fla) 是 的 函数 ,那么 ,有 = fla) BBN 
MLE。 

(7) 参数 a 的 MLEa 的 渐 近 抽样 方差 可 以 从 对 数 似 然 函数 的 二 阶 导 数 中 


1 
= 可 二 wee (a) | 


[3.17] 


va) = 


u(& ) 的 分 母 称 为 “期 望 信息 ”或 者 “Fisher 信息”[51] ， 


d’ log. rw] 


Ia) = El = 





我 们 将 MLE& 代入 方程 3. 17, 可 以 得 到 渐 近 抽样 方差 的 估计 0 Ca) 2 
(8) LCE ) 是 似 然 函数 在 MLEa 上 的 值 ,此 时 ,L(a) 对 于 真 ( 但 往往 是 未 知 
的 ) 参 数 a 是 一 个 似 然 函数 。 那 么 ,其 对 数 似 然 比 率 统计 量 


L(@) 
Lla) 





G = 2log, = 2[ log. L(@ ) — log. L (a) ] 


遵循 自由 度 为 1 的 渐 近 卡 方 分 布 。 因 为 通过 定义 ,MLE 在 我 们 特定 的 样本 中 最 
大 化 了 似 然 函 数 ,那么 在 真 参 数值 a 下 的 似 然 函数 值 通常 比 在 MLE& 下 的 小 
(除非 a 和 < 碰巧 相等 )。 

如 何 构 建 这 些 结果 超出 了 本 章 的 范围 ,然而 这 些 结 果 的 确 可 以 给 我 们 带 来 
一 些 直 观 的 感觉 。 例 如 ,如 果 对 数 似 然 函 数 有 一 个 尖锐 的 峰 ,那么 很 明显 , MLE 
是 由 其 临近 值 求 导 得 来 的 。 在 这 种 情况 下 ,其 二 阶 导数 是 一 个 较 大 的 负数 。 我 
们 可 以 发 现 ,数据 里 隐藏 了 许多 有 关 参 数值 的 “信息 ”, MLE 的 抽样 方差 比较 
小 ,等 等 。 相 反 ,如果 对 数 似 然 函 数 在 其 最 大 值 上 表现 得 比较 平坦 ,那么 与 MLE 
差异 很 大 的 可 替换 估计 可 能 和 MLE 一 样 好 用 。 这 样 的 话 ,数据 中 就 很 难 发 现 
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有 关 参 数值 的 “信息 ”, 同 时 ,MLE 的 抽样 方差 也 很 大 ( 见 图 3. 26) 。 


可 信 度 


leg 二 人 低 的 信息 可 信 度 高 的 信息 





1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
I 

peor dese 
1 
1 
1 
1 
1 
1 
1 
1 
1 

~ 
a 


注 :一 个 为 尖锐 峰 , 提 供 可 信和 度 高 的 参数 a 信息 ; 另 一 个 为 平坦 峰 , 提 供 的 参数 信息 可 信 度 低 。 
图 3.26 两 个 对 数 似 然 函数 





统计 推论 : Wald 检验 、 似 然 率 检验 与 记分 检验 


前 面 介绍 的 有 关 最 大 似 然 估计 量 的 属性 ,直接 引出 了 用 来 检验 假设 日 ,: 
a = œ 的 3 个 常用 统计 量 :Wald 检验 、 似 然 率 检验 和 记分 检验 。 记 分 检验 有 时 
称 为 “ 拉 格 朗 日 乘 数 检验 ”。Wald 检验 和 似 然 率 检验 可 以 用 来 产生 a 的 置信 
区 间 。 
(1) Wald 检验 :根据 MLE& 的 渐 近 正 态 性 ,我 们 可 以 计算 检验 统计 量 
Z — â ~ Qi 
° nie 
它 在 H, 下 是 以 N(0, 1) 渐 近 分 布 的 。 
(2) 似 然 率 检验 :运用 对 数 似 然 率 后 ,检验 统计 量变 为 : 
G = 2log, a = 2[ log. L(&)— log. L (ao) | 


-\ Qo 





它 在 H, 下 是 以 Xi 渐 近 分 布 的 。 
(3) 记分 检验 :我 们 知道 SCa) = dlog, L (a) /da 是 对 数 似 然 函数 在 a 时 的 斜 
率 。 在 MLE 时 ,记分 为 0:S(& ) = 0。 那 么 ,记分 统计 量 的 表达 式 为 ， 
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CE H, 下 是 以 N(0, 1) 渐 近 分 布 的 。 

尽管 这 3 个 检验 是 渐 近 等 价 的 ,但 是 除非 对 数 似 然 函数 是 二 次 型 的 ,否则 3 
个 检验 统计 量 对 同一 个 指定 样本 所 得 到 的 结果 会 有 些许 不 同 。 在 特定 情况 下 ， 
记分 检验 的 实际 优势 在 于 ,其 不 需要 计算 MLEa (因为 So 只 依赖 于 空 值 m , 它 
已 经 由 H 指定 )。 在 大 多 数 小 样本 量 的 情况 下 , 似 然 率 检验 比 Wald 检验 和 记 
分 检验 更 可 靠 。 

图 3. 27 描述 了 3 种 检验 之 间 的 关系 ,并 阐明 了 每 个 检验 的 理性 直觉 。 
Wald 检验 度量 了 《 与 wm 之 间 的 距离 ,并 用 标准 误 校准 了 该 距离 。 如 果 & 离 
ao 较 远 ,那么 我 们 可 能 要 质疑 一 下 及,。 似 然 率 检验 度量 了 log. Le )5 log. L 
(oo) 之 间 的 距离 ,如 果 log. L 人) 比 log. 工 (ao) 大 得 多 ,那么 Ho 可 能 出 错 了 。 记 
分 检验 的 统计 量度 量 了 对 数 似 然 函 数 在 ao 时 的 斜率 ,如 果 该 斜率 很 陡 , 那 么 ,可 
能 离 似 然 函数 的 峰值 较 远 , 此 时 ,我 们 仍然 要 质疑 Hb 


似 然 率 检验 





注 : 似 然 率 检验 将 log. LCE )5 log. L Cay) 比较 ; Wald 检验 将 & 
log. L (a) 的 斜率 。 


dT 


ao 比较 ;记分 检验 检验 a= ao 时 


图 3.27 假设 检验 Hy :ax 一 oo 
相关 说 明 
现在 我 们 要 把 这 些 结果 运 用 到 之 前 的 例子 中 , 即 在 ”次 掷 硬币 中 得 到 正面 
的 概率 +。 之 前 提 到 ,x 的 MLE 就 是 样本 比例 二 X/n, 其 中 ,X 记录 了 样本 中 
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出 现 正面 的 次 数 ,对 数 似 然 函数 的 二 阶 求 导 ( 方 程 3. 16) 为 : 








dlog L) __ X | n—X D | 
( 





注意 , EX) = nr, 那么 期 望 信息 为 : 





Aai aa i as 
a WERT va) = (IG)! = rAr), 与 期 望 信息 相似 。 对 于 此 例 ， 
渐 近 方差 恰好 就 是 x 的 有 限 样 本 方差 ,其 估计 渐 近 抽样 方差 是 OG) = 多 (1 一 
NR) /no 
在 我 们 的 样本 中 , 折 硬 币 次数 n = 10, 得 到 7 次 正面 的 渐 近 抽样 方差 为 
0(#) = (0. 7X0. 3)/10 = 0. 0210, 根据 Wald 检验 ,x 的 95% 渐 近 置 信 区 间 为 : 


x 二 0.7 士 1. 96X v0.02010 = 0.7 +0. 284 


其 中 ,在 双 尾 检验 中 ,1. 96 为 右 侧 尾部 概率 是 0. 025 的 标准 正 态 分 布 值 。 我 们 
还 可 以 用 Wald 检验 统计 量 来 计算 。 假设 Ho:x = 0. 5, 


0. 7=0..5 
V0. 02010 


其 所 对 应 的 N(0, 1) UB p 值 为 0. 168. 
我 们 知道 ,对 数 似 然 函数 为 : 


Ly = = 1. 38 


log. L(x) = Xlog. x + (n— X)log.(1 — x) 
= 7log. x + 3log. (1 — x) 


代入 具体 数值 后 ,得 到 : 
log. L(x) = 7log. L (0. 7) + 3log. L(0. 3) =— 6. 1086 


log. L (mo) = 7log. L(0. 5) + 3log. L (0. 5) =— 6. 9315 
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因此 ,Ho 的 似 然 率 检验 统计 量 为 : 


Gi = 2[—6.1086—(—6.9315)| = 1. 646 


其 所 对 应 的 p 值 (从 Xi 分 布 得 到 ) 为 0. 199。 
最 后 ,对 于 记分 检验 ， 








SC) = dlog. L(x) _X_n—X 
dr 元 l—-x 
那么 ， 
see = 
其 在 No 时 的 期 望 信息 为 : 
Noe 10 = 
IG) = 100.5) = 0.50.5 40 
因此 记分 统计 量 为 : 
Sx 8 
So = 3 = = 1. 265 
WT(Cro ) V40 


其 对 应 的 NO, 1) 双 尾 检验 的 p 值 为 0. 206。 
这 3 个 检验 结果 都 比较 一 致 且 合理 ,然而 却 都 不 太 准 确 。 通 过 用 X 的 零 二 
项 分 布 的 精确 检验 (出 现 正 面 的 数目 ) ,得 到 : 


0, 5” 





10 10 
p(z) = 0. 570. 5 = 
L X£ 


其 产生 的 双 尾 检验 的 p 值 为 0.3438。 从 这 个 例子 中 得 到 的 经 验 是 ,在 小 样本 量 
数据 中 应 用 渐 近 结果 时 一 定 要 小 心 。 


相关 参数 


最 大 似 然 方法 可 以 推 吧 含有 多 个 参数 的 线性 联 立方 程 中 ,让 p( X | ) 表 


nXm) (kX1) 


示 个 可 能 的 多 元 观测 XC m > 1 ) 的 概率 或 者 概率 密度 ， 这 些 多 元 观测 和 个 
独立 参数 a 有 关 。[53] 
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{WSR PRB Lo) = La | X) 是 @ 的 函数 ,此 时 要 寻找 一 个 &@ 使 得 函数 最 大 。 
与 之 前 相同 ,我 们 用 log. L Co) {RE 工 (a) 。 要 最 大 化 似 然 函 数 ,我 们 要 先 计 算出 
向 量 偏 导 9log. L (a)/9@ 并 使 其 为 0, 然 后 来 解 矩 阵 方程 求 & 。 如 果 解 方程 结果 
发 现 有 不 止 一 个 根 ,这 时 ,我 们 就 要 选 那 个 可 以 产生 最 大 似 然 值 的 根 。 

与 单个 参数 的 例子 一 样 ,基于 充分 统计 量 的 条 件 , 最 大 似 然 估 计量 是 一 致 、 
渐 近 无 偏 、. 渐 近 有 效 且 为 渐 近 正 态 分 布 的 。MLE 的 渐 近 方差 一 协 方差 矩阵 为 : 


A m 2’ log. Lto | . 
an 7 | E| Jaa | [3.18] 





方程 3. 18 PES HAH ERG Ig CO” OR SEA RE RA) O41 Ah, R 
B= fla), IKA B H MLE WB = /(&)。 注 意 类 比 多 参数 方程 和 单一 参数 
方程 。 
以 下 为 记分 检验 和 Wald 检验 的 推广 。H, 的 Wald 统计 量 在 a = a 时 为 : 
Z =w) O 2)" (E — mw) 
记分 向 量 为 Sla = Ilog, L(a)/da, 那么 记分 统计 量 为 : 


S = SC) I Cao) SC ) 


似 然 率 检验 可 以 直接 推广 为 : 


这 3 个 检验 统计 量 都 在 Ho 下 遵循 渐 近 分 布 ( 如 次 )。 

每 种 检验 都 应 该 适应 相对 更 复杂 的 假设 。 例 如 ,我 们 想 检验 假设 H,, 其 a 
中 & 个 元 素 的 p 和 某 个 特定 值 相等 。 我 们 让 La ) 代 表 在 某 些 假设 限制 下 的 
最 大 似 然 函 数 (例如 , 设 一 系列 参数 p 与 某 假 设 的 一 系列 数值 相等 ,但 其 他 的 参 
数 可 任意 估计 );L(& ) 表 示 放 开 限 制 后 整体 的 最 大 似 然 函数 。 那 么 在 Ho 假 
iF. 


G = 2log. | 





L(@) ] 
La) 
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CEA BEN p 的 渐 近 卡 方 分 布 。 


下 一 个 例子 (Theil, 1971: 389—390) 阐明 了 以 下 结果 :对 于 一 个 从 均值 为 
方差 为 a 的 正 态 分 布 得 来 的 2” 个 独立 观测 样本 X; ,我 们 想 估计 / 和 o?。 已 


知 似 然 函 数 为 : 





= 1x 
= (270’) Bep = (X; =F 
那么 ,其 对 数 似 然 函数 为 : 
1 
log. L Cu, o) == Flos, 2x — + logo” gad (X;—p)? 


其 偏 导 为 : 





alog. Lus) 1 
er = eX) 





log. Llu, >) 1 ; 
E foo. 一 aa tga oy he 


Io 


令 偏 导 等 于 0, 求 得 yj、o 的 估计 量 分 别 为 : 











Dux: y 
八 — =X 
n 
a AR- 
n 
对 数 似 然 函 数 的 二 阶 偏 导 和 矩阵 为 : 
Flog L 3log. L on 1 
Oe Ido" g? — 22 (X; = je) 

J log. Ld’ log. L 7 ae a n 1 
do’ Ip I) FX e 20° FX g 


取 期 望 值 会 得 到 期 望 信息 矩阵 的 负 阵 ,注意 , EX: — u) = 0, ECX;—p)’ S, 
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n 
=> 0 


— Ilp, o) B 
n 


oo ae 


我 们 知道 ,最 大 似 然 估计 量 的 渐 近 方差 一 协 方差 矩阵 即 其 信息 矩阵 的 逆 阵 : 


Z 0 
OA 6") = [Ins o) |! = 


4 
o 2d 


从 一 莹 的 抽样 方差 为 (o/zz) 。o 的 MLE 虽然 有 偏 ,但 却 是 一 致 的 ( 即 方程 3. 12 
中 的 估计 量 SY). 

在 许多 应 用 中 ,数据 包含 了 一 个 含有 个 同 分 布 观测 的 独立 随机 样本 。 数 
据 整体 的 似 然 函数 为 所 有 观测 的 似 然 函数 乘积 L;(&) ,那么 数据 整体 的 对 数 似 
然 函 数 则 为 所 有 观测 的 对 数 似 然 函 数 之 和 : 


log. L(a) = >) log. L; (a) 
i=1 


因此 ,记分 函数 为 逐个 观测 相关 项 之 和 : 





S(a) = X Sw = J DELW 
i=1 ;一 1 G 


最 后 ,样本 信息 是 一 个 个 体 观测 中 所 包含 的 信 信 息 ( 记 做 工 ): 


| 


Ia) = > h = nE| = 


结果 之 所 以 如 此 ,是 因为 似 然 函数 的 二 阶 导 数 对 n 个 观测 都 是 相同 的 。 
Delta 算法 


如 前 所 述 ,假如 B= fla), Ha 为 a 的 最 大 似 然 估计 量 ,那么 , 8 = f(&) 
为 8 的 最 大 似 然 估计 量 。 这 意味 着 f 是 渐 近 正 态 分 布 的 , 且 其 渐 近 期 望 值 为 
8, 即 使 函数 f(，) 是 非 线性 的 。 
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利用 f(a ) 泰 勤 展 式 估计 在 « 处 一 阶 展开 ,Delta 算法 产生 了 一 个 有 渐 近 方 
差 的 估计 : 
B =F = f@ + A & —a) [3. 19] 


其 中 , fla) = df(a)/da 为 f(a) 对 a HORE. 
方程 3. 19 右边 的 f(a) 是 一 个 常数 (因为 参数 a 是 定 值 ), 第 二 项 是 关于 a 
的 线性 函数 ,由 于 a 为 定 值 ,因此 F (Qa) 为 常数 ,所 以 ， 


(8) ~ [rE] ele) 
其 中 ,v(& ) 为 & 的 渐 近 方差 。 在 实际 应 用 中 ,我 们 用 最 大 似 然 估 计量 & 代替 
a, 进 而 获得 Â 的 渐 近 方差 估计 值 : 
0(8) =[s'(@) Jole) 
为 了 解释 Delta 算法 的 应 用 ,让 我 们 先 回顾 一 些 概念 ,样本 配 比 多 Oh 


比 赤 的 最 大 似 然 估 计量 ,其 渐 近 (实际 上 是 有 限 样本 ) 方 差 为 坟 多 ) = x(1 一 
m/n, 其 中 ,n 为 样本 大 小 。 对 数 优 比 或 者 logit 的 定义 为 ， 





A= f(r) = log. = 
A 的 最 大 似 然 估 计量 为 A = log. [2/1 — 2) ], logit 样本 的 样本 渐 近 方差 为 : 
CÂ) Cf’ Gr) ule) 


= | 1 ] xO — 7) 


n(l— r) x 





= 1 
~~ me 1—x) 
最 后 ,logit 样本 的 样本 方差 渐 近 估计 值 为 5(A) = 1/| ne (1—8) |. 
Delta 算 法 可 以 直接 扩展 到 具有 多 个 参数 的 函数 中 。 假设 8 = fla, 
azs ty a) = f(a), 且 人 为 a 的 最 大 似 然 估计 量 ,其 渐 近 方差 为 (人 ) ,那么 ， 
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和 =f(& ) 的 渐 近 方差 为 : 


(f) ~ [sw (G)g0) = >) Yo x aĝ x 28 


9 
i=l Jaj 


其 中 , g(a) = 96 /da, vj 为 ul OE ITE WTR. B 的 估计 渐 近 方差 为 : 
0(8) =|g(&) | v(@)e(@) 


Delta 算法 不 仅 适用 于 最 大 似 然 函 数 的 估计 量 , 而 且 适 用 于 其 他 渐 近 正 态 
分 布 的 佑 计量 。 


贝 叶 斯 推断 


本 章节 引入 另 外 一 种 统计 推断 , 即 贝 叶 斯 推断 。 这 里 主要 解释 贝 叶 斯 推断 
的 核心 思想 ,细节 的 部 分 将 会 被 省 去 。 


贝 叶 斯 定理 
首先 ,我 们 来 回顾 条 件 概率 的 定义 。 已 知事 件 B 会 发 生 ,A 发 生 的 概率 为 : 


Pr(A | B) = Prane [3.20] 


同样 ,B 关 于 A 的 条 件 概率 为 : 


Pr(B | A) = Peas) [3. 21] 


将 方程 3. 21 进行 变换 ,得 到 A AB 的 联合 概率 : 
Pr(A N B) = Pr(B | A)Pr(A) 
并 将 其 代入 方程 3. 20, 可 得 到 贝 叶 斯 定理 ; 


Pr(B | A)Pr(A) 


Pr(A | B) = Pr(B) 





[3. 22] 
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贝 叶 斯 定理 是 以 18 世纪 英国 数学 家 托马斯 。 贝 叶 斯 (Thomas Bayes) 命 名 的 。 

贝 叶 斯 统计 推断 是 基于 方程 3. 22 的 推断 。 让 A 代表 某 未 知 命题 ,我 们 想 
和 弄 清楚 其 正确 与 否 (例如 这 样 一 个 命题 :一 个 参数 等 于 某 特定 值 )。 让 B 代表 与 
真 命题 相关 的 观测 数据 。 无 条 件 概率 Pr(A) 为 A 的 先 验 概 率 , 它 是 在 获得 数据 
之 前 ,我 们 确信 A 为 真 的 概率 ;Pr(BIA) 是 假设 A 为 真 时 获得 观测 数据 的 概率 ， 
即 给 定 A 的 似 然 度 。 数 据 B 的 无 条 件 概率 为 : 


Pr(B) = Pr(B | A)Pr(A) + Pr(B | A)Pr( A) 


ABA ,方程 3. 22 中 的 Pr(A1B) 就 是 A 的 后 验 概 率 , 表 示 获 得 数据 后 所 修正 的 
A 为 真 的 概率 。 

贝 叶 斯 推断 是 基于 证 据 、 检 验 先 验 的 理性 过 程 。 主 观 论 者 和 客观 论 者 关于 
概率 的 理解 是 相反 的 。 贝 叶 斯 理论 由 初等 概率 理论 发 展 而 来 ,随后 便 引 出 了 贝 
叶 斯 统计 推断 的 一 般 过 程 。 

初步 案例 

考虑 如 下 的 简单 情况 :假设 你 有 两 个 有 偏差 的 ”硬币 ,在 抛掷 过 程 中 , 其 中 
一 个 得 到 正面 的 概率 为 Pr(H) = 0.3, 另 一 个 为 Pr(H) = 0. 8。 每 个 硬币 都 分 
别 被 装 在 盒子 里 , 且 在 盒子 上 标明 了 它 的 偏差 。 但 是 你 不 小 心 把 盒子 都 弄 丢 
了 ,只 好 把 硬币 都 放 在 抽 民 里 。 一 年 后 ,你 忘记 了 哪个 硬币 是 哪个 。 为 了 区 分 
它们 ,你 随便 挑 了 一 个 ,然后 抛 了 10 下 ,得 到 结果 为 HHTHHHTTHH—7 
次 正面 ,3 次 反面 。 

让 事件 A 代表 选取 了 硬币 Pr(H) = 0.3, 那么 A 为 事件 选取 Pr(H) = 
0. 8。 在 这 种 情况 下 ,我 们 有 理由 选择 先 验 概率 Pr(A) = Pr(A) = 0.5, 那么 数 
据 的 似 然 度 为 : 

Pr(B | A) = 0.37(1 一 0.3)3 = 0. 0000750 


Pr(B | A) = 0.87(1—0, 8)? = 0. 0016777 


请 注意 ,常见 观测 数据 的 似 然 度 在 两 种 情况 下 都 很 小 ,但 是 A 的 情况 更 有 可 能 。 
利用 贝 叶 斯 定理 (方程 3. 22) ,我 们 可 得 到 后 验 概率 ， 
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0. 0000750 X 0. 5 
0. 0000750 X 0. 5 + 0. 0016777 X 0. 5 





Pr(A | B) = = 0. 0428 


0. 0016777 X 0.5 


Pr(A | B) = 979000750 x 0. 5 + 0. 0016777 XO, 5 


= 0. 9572 





此 结果 说 明 ,所 选 的 硬币 为 PrCH) = 0. 8 的 概率 比 Pr(H) = 0.3 的 概率 更 大 。 
贝 叶 斯 定理 扩展 


贝 叶 斯 定理 可 以 轻易 地 扩展 到 多 于 两 个 假设 A 和 A 的 情况 。 比 如 有 多 个 
假设 Hi, Hz, +, Ae ,其 先 验 概率 分 布 为 Pr(H;), i= 1,…, 上, 且 所 有 先 验 概 
率 的 和 为 155] ;让 DD 代表 观测 的 数据 ,并 有 似 然 度 PrCD|H;), i= 1, …,&, 那 
么 ,假设 日 ; 的 后 验 概率 为 : 


Pr(D | H;) Pr(H;) 


Pr(H; | D) = 3 
> ;Pr(D | H;)Pr(H,) 





L3. 23] 


方程 3. 23 的 分 母 确 保 了 在 所 有 假设 下 ,后 验 概率 的 和 为 1。 有 时 候 , 为 方 
便 起 见 ,我 们 可 以 省 略 这 个 标准 化 ,将 其 简单 表示 为 : 


Pr(H; | D) cc Pr(D | H;)Pr(H;) 


即 一 个 假设 的 后 验 概率 与 该 假设 下 的 似 然 度 和 其 先 验 概率 的 乘积 成 正比 。 如 
果 有 必要 ,我 们 可 以 除 以 >) Pr(D | Hi;)Pr(H;) 来 复原 后 验 概率 。 

贝 叶 斯 定理 对 于 随机 变量 同样 适用 。 让 a 代表 我 们 感 兴趣 的 参数 , 它 的 先 
验 概 率 分 布 或 者 密度 为 pl(a); 让 L(a) = p(D | a) 表示 参数 a 的 似 然 函数 , 那 
么 有 : 

al D = La) pla) 
ia D Lapa) 

其 中 ,a 是 离散 的 ,或 者 


sa m OB) 
[Lapa Yd 
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因为 在 更 普遍 的 情况 下 ,a 是 连续 的 。 在 两 种 条 件 下 都 有 : 
pla | D) oc Lla) pla) 


即 后 验 分 布 或 者 密度 与 似 然 函数 和 先 验 概率 (或 者 密度 ) 的 乘积 成 正比 。 跟 前 
面 一 样 ,如 果 有 需要 ,我 们 可 以 除 以 >)L Ca) pCa’) 或 者 [Lpa dda’ 来 复原 
后 验 概率 或 者 密度 。 

有 两 点 需要 提 及 : 

首先 ,进行 贝 叶 斯 推断 之 前 ,我 们 要 求 参数 a 的 先 验 分 布 p(a) 是 合理 的 。 

另外 ,与 经 典 统 计量 相反 ,我 们 把 a 当做 一 个 随机 变量 而 不 是 未 知 常数 ,所 
以 我 们 保留 希腊 字母 。 然 而 ,由 于 与 数据 不 同 ,参数 永远 不 能 确定 一 一 即使 已 
经 获得 了 数据 。 

LRA 

当先 验 分 布 已 经 选 定 , 且 似 然 函数 和 先 验 概率 的 乘积 所 得 到 的 后 验 分 布 与 
该 先 验 分 布 属于 同一 个 系列 ,此 时 贝 叶 斯 推断 的 数学 会 变 得 很 简单 。 我 们 把 这 
种 情况 的 先 验 分 布 叫做 “ 共 斩 先 验 ”。 

贝 叶 斯 推断 曾经 只 在 共 斩 先 验 的 情况 下 才 有 实用 价值 。 然 而 , 随 着 计算 机 
软件 和 硬件 的 发 展 ,通过 随机 取样 ,数学 上 难以 解决 的 后 验 分 布 变 为 可 能 。 比 
如 马尔 科 夫 链 蒙特 卡 罗 抽 样 (Markov Chain Monte Carlo，MCMC) 使 得 贝 叶 斯 
能 广泛 应 用 于 统计 学 。 但 是 不 论 怎 样 , 先 验 分 布 的 选择 是 非常 重要 的 。 


贝 叶 斯 推断 的 例子 


让 我 们 继续 之 前 的 例子 一 一 掷 硬 币 ,我 们 想 通过 估计 得 到 硬币 正面 的 概率 

rr 但 是 在 少量 离散 值 中 又 无 法 限制 rx。 原 则 上 ,r 可 以 为 0 到 1 之 间 的 任意 数 

值 。 要 估计 ,需要 收集 10 次 独立 投掷 的 数据 。 从 之 前 的 伯 努 利 似 然 函 数 中 ， 
我 们 知道 : 

Ln) = (1— r) [3. 24] 


其 中 ,h 为 观测 到 的 出 现 硬币 正面 的 次 数 。 通 过 实验 ,我 们 得 到 数据 HHTH- 
HHTTHH, Alt, h =7, 
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ag 重生 有 
方程 3. 24 伯 努 利 似 然 函 数 的 共 恩 先 验 即 贝塔 分 布 ， 


x! (1 ato mr)?! 


ii Se eee 


pr) = 


当 贝 塔 先 验 与 似 然 函 数 相 乘 后 ,我 们 得 到 了 一 个 后 验 密度 形式 ; 


pir | D) oc ote ad — x) ee paes ne (1 — g) 





即 贝塔 分 布 的 形状 参数 为 h 十 a = 二 7 十 a, 10 一 /十 2 一 3 十 5。 在 效果 上 , 先 验 概 
率 在 似 然 函 数 里 将 a 和 2 分 别 加 到 了 出 现 正 面 和 反面 的 次 数 中 。 

那么 我 们 应 该 如 何 选择 a 和 2 呢 ? 方法 之 一 可 以 反映 你 对 似 然 值 x 的 主观 
估计 。 例 如 ,如 果 一 个 硬币 本 身 没有 问题 ,那么 x 的 值 会 很 接近 0. 5。 假 设 取 
4 一 0 一 16, 那 么 ,x 就 会 被 限制 在 0. 3 到 0.7 的 区 间 内 ( 见 图 3.15)。 如 果 对 该 
限制 不 太 满意 ,对 于 a 和 2 ,我们 可 以 取 小 一 点 的 值 。 当 a4 = b= 1 时 ,x 的 所 有 
值 都 可 能 相等 ,这 就 是 所 谓 的 “扁平 先 验 分 布 ”, 它 完全 忽略 了 x 值 .156] 

图 3. 28 描述 了 x 在 两 种 先 验 下 的 后 验 分 布 。 在 扁平 先 验 下 ,后 验 和 似 然 函 
数 成 正比 ,因此 ,如 果 我 们 取 后 验 的 众 数 作为 x 的 估计 ,那么 就 会 得 到 MLE = 
0.7。 557 相反 ,对 于 ua 一 0= 16 这 个 信息 先 验 ,其 众 数 在 rz0.55, 它 和 r 一 0.5 
的 先 验 分 布 的 众 数 非常 接近 。 

令 人 不 安 的 是 ,该 结论 要 取决 于 关键 的 先 验 分 布 ,但 这 个 结果 却 是 在 少量 
的 样本 下 得 到 的 。 我 们 知道 ,在 这 种 情况 下 用 贝塔 先 验 如 同 在 数据 中 又 增添 了 
a 十 b 个 观测 。 随 着 样本 量 的 增加 , 似 然 函数 开始 占领 后 验 分 布 , 先 验 分 布 逐 渐 
被 掩盖 .L153] 对 于 此 例 , 如 果 找 次 硬币 ,其 后 验 分 布 的 形式 变 为 : 


pix | D) oc git (1 oor J tte 


FRR h SIEM Al n — h AAAA A AB SS BaD ASS I A. Ee, 
告诉 我 们 ,从 先 验 来 说 ,样本 量 小 时 所 要 考虑 的 加 权 要 比 样本 量 大 的 时 候 大 
得 多 。 





贝 叶 斯 区 闻 估 计 


在 经 典 统 计 推 理 中 ,我 们 期 望 得 到 的 不 仅 是 参数 的 一 个 点 估计 ,还 要 检验 
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估计 中 的 不 确定 性 。 参 数 的 后 验 分 布 直接 表示 了 统计 不 确定 性 。 通 过 后 验 分 
布 ,我 们 可 以 进行 多 种 贝 叶 斯 区 间 估 计 , 这 些 区 间 估 计 均 可 以 用 来 和 经 典 置信 
区 间 进 行 对 比 。 

一 个 简单 的 选择 是 中 央 后 验 区 间 : 总 共 含 100a 百分比 的 中 央 后 验 区 间 为 从 
一 Q)/2 到 (1 十 a)/2 的 分 位 数 。 与 以 解释 复杂 而 著名 的 经 典 置 信 区 间 不 同 , 贝 
叶 斯 后 验 区 间 的 解释 很 简单 :概率 是 0. 95 表示 其 参数 落 在 95% 的 置信 区 间 内 。 
该 差别 反映 了 贝 叶 斯 参数 解释 是 把 参数 当做 一 个 随机 变量 ,对 数据 进行 观测 
后 ,其 通过 后 验 分 布 表达 了 对 参数 值 的 主观 不 确定 。 

两 个 后 验 分 布 的 95% 中 央 后 验 区 间 可 从 图 3. 28 中 看 出 。 








注 :a 二 1, b= 1 是 扁平 的 贝塔 先 验 ; a= 16, b= 16 是 信息 贝塔 先 验 。 其 中 ,在 10 次 掷 币 中 包含 7 次 
正面 。 两 个 靠近 图 底部 的 水 平 线 分 别 展示 了 相应 先 验 的 95%% 中 央 后 验 区 间 。 
图 3.28 在 两 个 先 验 分 布下 得 到 正面 概率 x 的 后 验 分 布 


贝 叶 斯 参数 推理 


贝 叶 斯 推理 可 以 直接 延伸 到 对 一 系列 参数 @ = Lars ars > a |” 的 同时 佑 
计 中 。 在 这 种 情况 下 ,有 必要 指定 参数 的 联合 先 验 分 布 pC(a) 和 联合 似 然 估计 
Lio). 那么 ,对 于 只 有 单一 参数 的 情况 ,联合 后 验 分 布 与 先 验 分 布 和 似 然 估 计 
的 乘积 成 正比 : 

pla | D) cc paLa) 
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该 推理 主要 关注 每 个 参数 的 边缘 后 验 分 布 p(ai |D). 
推荐 阅读 


大 多 数 介绍 性 的 数理 统计 和 计量 经 济 课本 都 会 涵盖 本 章 所 提 及 的 各 个 主 
题 , 且 其 描述 更 为 正式 和 详尽 。 如 考 克 斯 (Cox) 和 欣 克利 (Hinkley)(1974) 的 著 
作 , 相 对 于 本 书 , 其 涉及 的 知识 较 难 。 还 有 策 尔 纳 (Zellner) (1983) 的 著作 ,其 结 
构 紧 凑 , 与 考 克 斯 (Cox) 和 欣 克利 (Hinkley)(1974) 的 书 相 比 ,较为 简单 。 旺 纳 
科 特 兄弟 的 (Wonnnacott & Wonnnacott，1990) 著 作用 相对 简单 的 数学 知识 对 
本 章 涉及 的 话题 进行 了 深刻 诠释 。 如 果 你 觉得 本 章 相关 章节 过 于 精炼 且 缺 少 细 
节 , 那 么 我 认为 这 本 书 无 疑 是 一 本 非常 合适 的 书籍 。 同 时 ,关于 渐 近 分 布 理 论 还 
有 泰 尔 (Theil) (1971) 的 著作 。 关 于 Wald 检验 、 似 然 率 和 记分 检验 还 可 参看 英 
格 尔 (Engle) (1984) 的 著作 。 最 后 ,对 于 贝 叶 斯 推理 的 相关 内 容 , 兰 开 斯 特 (Lan- 
caster)(2004) 的 书 确实 是 一 本 经 典 之 作 。 


第 4 章 | 实际 应 用 :线性 最 小 二 乘法 回归 


这 本 书 的 重点 在 于 介绍 社会 统计 学 的 数学 方法 ,而 不 在 于 统计 方法 本 身 。 
不 过 ,我 还 是 觉得 有 必要 介绍 如 何 将 数学 应 用 到 统计 学 方法 中 。 所 以 ,本 章 的 
目的 是 阐述 线性 最 小 二 乘法 回归 这 一 统计 方法 的 发 展 过 程 一 一 一 个 读者 所 熟 
悉 的 话题 以 及 由 此 推 衍 的 相关 特性 。 

首先 ,本 章 将 描述 最 小 二 乘法 的 数学 性 质 ,但 是 这 只 是 统计 学 的 一 部 分 。 
虽然 数学 在 应 用 统计 学 中 扮演 了 重要 的 角色 ,但 是 应 用 统计 学 不 全 是 数学 ,其 
范围 更 广 ,例如 ,有 关 方 法 论 的 话题 。 此 外 ,线性 最 小 二 乘 回 归 在 几 个 方面 代表 
了 应 用 统计 学 的 核心 方法 , 且 在 统计 学 中 经 常用 到 , 它 容易 扩展 到 一 般 线性 模 
型 .广义 线性 模型 和 其 他 模型 ,并 为 其 他 统计 模型 提供 了 运算 基础 。 最 后 ,对 于 
线性 最 小 二 乘法 回归 在 数据 分 析 中 所 扮演 的 角色 ,需要 更 深入 的 探讨 。 因 此 ， 
我 认为 这 是 一 本 有 关 应 用 回归 分 析 比 较 合 适 的 教材 (Fox，2008) 。 

本 章 将 把 前 面 几 音 所 学 的 内 容 应 用 到 统计 方法 中 :第 1 章 的 矩阵 和 线性 代 
数 ,包括 矩阵 秩 和 线性 联 立 模型 ;第 2 章 中 最 优化 问题 所 用 到 的 矩阵 微 积 分 ;第 
3 章 的 概率 论 、 统 计 分 布 . 估 计量 性 质 和 最 大 似 然 法 估计 。 


最 小 二 乘法 拟 合 


一 个 线性 回归 方程 可 以 写成 : 
Y; = A + Biza + Bzrzt ++ + Bixa +E; [4. 1] 


其 中 Yi 是 nn 个 观测 中 的 第 i 个 定量 响应 变量 (或 者 “ 因 变 量 ”) ;zi 9 Xi29 °°°s Tk 
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为 第 i 个 观测 的 & 个 定量 解释 变量 (或 者 “ 自 变 量 ”); A, Bi, Bry +, Be 为 回归 
系数 ,A 为 回归 所 得 的 截 距 或 者 常数 ;系数 BG = 1, 2, +, k) 为 分 项 斜率 系 
数 ;E; 为 回归 残 差 ,表示 Y, 偏离 线性 回归 面 的 程度 。 





Y= A + Bixa + Bzziz + s+ Bita 


其 中 ,了 ;为 第 i 观测 的 拟 合 值 。 

注意 ,上 例 中 我 们 用 了 大 写字 母 Y; 和 Ei;, 这 表明 ,如 果 我 们 所 选择 的 (含有 
n 个 观测 的 ) 样 本 不 同 , 因 变量 的 值 就 会 改变 , 残 差 也 会 改变 。 因 此 ,Y; AE, 是 
随机 变量 。 同 样 ,因为 回归 系数 随 着 样本 的 改变 而 改变 ,所 以 它们 也 用 大 写字 
RRA. WL ,我 用 小 写字 母 表示 解 释 变量 ,表明 在 重复 抽样 中 ,它们 的 值 是 固 
定 的 ,这 是 典型 的 实验 设计 ,因为 所 有 自 变 量 x 都 是 由 研究 者 直接 控制 的 ,在 重 
复 实 验 中 不 会 改变 。 把 所 有 自 变 量 当 做 定 值 会 使 数学 变 得 简单 ,同样 也 会 使 之 
变 得 不 太 重 要 (但 不 是 绝对 不 重要 )。 在 下 文中 ,我 会 简要 地 对 一 系列 随机 变量 
X 进行 介绍 。 

我 们 将 最 小 二 乘法 回归 系数 ( 即 A 和 B 的 那些 可 以 使 残 差 平方 和 最 小 的 取 
值 ) 看 做 一 个 回归 系数 的 函数 , 则 有 : 





S(A, Bis =, BY = SE = Sv, -?)? 
i=1 i=1 





<= 7 (Y; A Bixa ons Bita) 
虽然 我 们 可 以 继续 用 标量 形式 ,但 是 矩阵 形式 更 有 优势 。 我 们 可 以 把 方程 
4. 1 改写 成 : 


y = X b +e 
(nX1) (nXk+1)(k+1X1) (nX1) 
HH, y= [mm Y2, 0, Yp] 是 一 组 观测 的 因 变量 向 量 ， 


1 II 8% Lik 


1 X21 coe Tk 


1 Tnl vee Xk 
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为 模型 (设计 ) 和 矩阵 , 它 包 含 了 解释 变量 及 首 列 为 1 的 回归 常数 (常数 回归 因子 ); 
b=(A, B, =, BI 包含 了 回归 系数 ; e=LE,, Ey, 0, E,) 为 一 个 残 差 向 
量 。 那 么 , 残 差 平方 和 为 : 
S(b) = ee 
= (y— Xb)’ (y— Xb) 





ae aso [4. 2] 
= y y—y Xb—b X’y+b’ X’Xb 


= y'y— 2y Xb+b X Xb 
由 于 y Xb 为 (1 xX 1), 因此 它 和 其 转 置 bX'y 相等 。 
为 最 小 化 残 差 平方 和 SCb) ,我 们 可 以 对 回归 系数 b 求 导 , 将 方程 4.2 代入 
可 得 : 


ISO) na / 
Ob = 0— 2X y+ 2X Xb 


使 之 为 0 并 移 项 ,可 得 线性 最 小 二 乘法 回归 的 正 态 方程 : 


/ / 


(k+1Xk+1)(k+1X1) (k+1X1) 


这 是 一 个 拥有 & 十 1 个 线性 等 式 和 A& 十 1 个 未 知 回归 系数 b 的 系统 方程 。 该 系统 
方程 的 系数 矩阵 为 : 

i n Yri S zz cae X ta ] 
Dza bye Statz moe >) fate 
XX = X zi S taza be >) tela 








[Oras Diteta Sižeta = Daa J 
它 包含 了 平方 和 及 模型 矩阵 的 列 的 交叉 乘积 。 方 程 右边 的 向 量 ，X'y = 
[DY xaY,，D) zaY,,…，》) zaY;] ,包含 了 模型 矩阵 每 一 列 交叉 乘积 
的 和 以 及 因 变 量 向 量 。 平 方 和 及 乘积 XX 和 X y 可 以 由 数据 直接 计算 得 到 。 

XX 是 满 秩 的 , 即 非 奇 异 的 ,假如 模型 矩阵 X 是 列 满 秩 & 十 1, 则 没有 一 个 自 
变量 是 其 他 自 变 量 的 完美 线性 函数 。 在 这 些 条 件 下 , 正 态 方程 有 唯一 解 : 


139 


140 | 社会 科学 中 的 数理 基础 及 应 用 
b= (XX) XYy [4.3] 


这 是 S(b) 的 一 个 最 小 值 ,因为 XX 是非 奇异 且 正 定 的 。 
一 个 线性 回归 的 统计 模型 


一 个 常用 的 线性 回归 统计 模型 为 : 
a + fiza Fezi sfe mes + Pex iz 十 esi 


其 中 ,Y; 为 n 个 样本 观测 中 的 第 i 个 响应 值 ;zx;，zis，…，zi 为 & 个 解释 变量 ; 
as Bis Bos sets Be 为 总 体 回归 系数 , 它 是 从 样本 数据 中 估算 得 来 的 ;e; 为 第 i 个 
观测 的 误差 变量 。 即 使 误差 不 是 随机 变量 ,我 们 还 是 用 希腊 字母 表示 ,因为 它 
不 能 直接 观测 。 我 们 假设 误差 是 正 态 分 布 的 , 且 其 均值 为 0, 方差 为 常数 上 人, 
一 N(0, 0 ) ,不 同 观测 的 误差 是 相互 独立 的 。 


最 后 ,将 线性 方程 写成 矩阵 形式 : 
BA = ee mn L4. 4] 
其 中 ,y 为 因 变 量 ,X 为 模型 矩阵 ,有 = [a, Bs Boos AT 为 总 体 回归 系数 向 


a= 


量 , e= [es e) t en] 为 误差 向 量 。 误 差 向 量 是 具有 纯 量 协 方差 矩阵 的 多 
元 正 态 分 布 向 量 ,e 一 和 N, (0, c 丈 )。 请 注意 ,由 于 它们 是 独立 的 ,所 以 不 同 的 误 
差 是 不 相关 的 。[59] 
因 变 量 y 的 回归 遵循 e 的 回归 : 
u= Ely) = ECXB 十 s) 
= XP+ Ele) = Xp 


V) = EL(y—p)(y—p)’] 





= EL(xp+ «— Xp) (Xp+ e— Xp)’ } 
= Else’ | = ol, 


y ~ N, (Xp, ol,) 


社会 统计 的 数学 基础 


因此 ,假设 Ele) = 0 ,那么 ECGy) 是 X 的 线性 函数 。 


作为 估计 量 的 最 小 二 乘法 系数 


方程 4. 3 的 最 小 二 乘法 回归 系数 b 可 能 可 以 用 来 估计 方程 4.4 的 线性 回归 
模型 的 系数 。 由 于 b 是 由 因 变 量 y 经 过 线性 变换 得 来 的 ,因此 ,最 小 二 乘 估计 量 
的 性 质 可 以 简单 表现 为 : 
b = (XX) 'X’y = My 
其 中 ,变换 矩阵 M = (X X) 一 X 。 因 为 模型 矩阵 X 对 于 重复 抽样 是 固定 的 ,所 以 
M 亦 如 此 。 那 么 ， 
E(b) = ME(y) = (XX) 'X’Xp= B 
因此 可 证 明 ,b 为 有 的 无 偏 估计 量 。 请 注意 ,该 结论 取决 于 假设 Ey) = Xp E 
线性 假设 ) 。 
b 的 协 方差 矩阵 可 从 常数 误差 方差 和 误差 不 相关 , 即 V(y) 二 ol 的 假设 
得 来 : 
V(b) = MV(y)M’ 
= [(XX) X PLEX XX J 
=o (XX) RN XX) 
= gf (X XY! 
最 后 ,根据 误差 正 态 分 布 假设 ,我 们 有 : 
b~ N LB. o (xX)! ] [4. 5] 


最 小 二 乘法 估计 量 b 不 仅仅 是 的 一 个 无 偏 估计 量 , 而 且 在 线性 、 常 误差 方 
差 和 独立 性 假设 下 ,是 数据 线性 函数 的 一 个 最 小 方差 无 偏 估计 量 。 该 结果 称 为 
“高 斯 -马尔 科 夫 定理 ”(Gauss-Markov Theorem) ,常用 来 支持 最 小 二 乘法 估计 ， 
但 是 不 太 支 持 最 小 二 乘法 估计 量 。 当 误差 分 布 为 非 正 态 时 ,数据 的 其 他 非 线 性 
无 偏 估计 量 ( 所 谓 的 稳健 性 回归 估计 量 ) 比 最 小 二 乘 估计 量 更 为 有 效 。 但 是 , 当 


141 


142 


| 社会 科学 中 的 数理 基础 及 应 用 


误差 是 正 态 分 布 的 时 候 , 最 小 二 乘法 估计 量 将 是 所 有 无 偏 估计 量 中 最 有 效 、 最 
可 信 的 [6o] 


回归 模型 的 统计 推断 


有 关 总 体 回归 系数 的 统计 推断 ,除了 点 估计 外 ,都 很 复杂 ,因为 我 们 基本 
上 不 知道 误差 方差 o ,所 以 不 能 直接 将 方程 4. 5 用 于 b 的 最 小 二 乘 估计 量 的 分 
布 。 我 们 必须 先 估 计 o。 

P 的 一 个 无 偏 估 计量 为 : 


n 2 
=. eJ i=1 E; -_ ee 
a=k] wR I 





S? 





其 中 , n—k—1 为 误差 的 自由 度 ( 估 计 甩 的 & 十 1 个 元 素 时 ， 损 失 ” 了 A 十 1 个 自 
HE). ABA. ,估计 的 最 小 二 乘 协 方差 矩阵 为 : 


SE = LXX) 


b 的 对 角 元 平方 根 为 回归 系数 的 标准 差 :.SE(A), SE(B1),…, SE(B,)。 
个 体 回归 系数 的 推断 是 建立 在 1 分 布 上 的 。 例 如 ,检验 零 假设 H,: 8 = 
B,，，, 即 斜率 系数 等 于 一 个 特定 值 8;”( 一 般 为 0) ,我 们 可 以 计算 检验 统计 量 : 


(0) 


t E me 
" — SE(B,) 


它 在 零 假设 下 是 以 6, 分 布 的 。 同 样 , 建 立 一 个 忆 的 95% 的 置信 区 间 , 我 们 取 
B > B, + tnei, 0. 025 SE (B; ) 


其 中 ,oos 是 自由 度 为 2 一 & 一 1 右 侧 尾部 概率 为 0. 025 的 临界 值 。 
在 一 般 情况 下 ,我 们 可 以 检验 线性 假设 : 


A Ms axi 
其 中 ,志和 fc 包含 了 特定 的 常数 , 且 我 们 假设 矩阵 荆 是 行 满 秩 的 g 委 十 1。 那 么 ， 
下 统计 量 为 : 


Ho 
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_ (Lb— ce)’ [LXK "L’ -1(Lb 一 ec) 
g 2 


如 果 H 为 真 ,那么 , 它 遵 循 以 g 和 n —k—1 为 自由 度 的 下 统计 值 。 

假设 我 们 要 检验 一 个 包含 两 个 解释 变量 的 回归 模型 的 “ 联 立 ” 零 假设 Ho: 
p =p = 0, 我 们 可 以 取 工 一 |” 。 3 | 和 e = [0, 0 了。 为 了 检验 回归 系数 相 
等 , H:A =R (等 价 于 孔 :8 一 及 =0) ,我们 取 工 = [0, 1, 一 1] Me=[0], 6 

在 下 文 ,我 们 会 提 到 在 回归 模型 假设 下 ,回归 系数 的 最 小 二 乘 估 计量 等 价 
于 最 大 似 然 估 计量 。 因 此 , 当 样本 量 够 大 ,我 们 可 以 用 Delta 方法 来 推导 回归 系 
数 的 非 线性 函数 的 标准 差 。 

例如 ,考虑 如 下 二 项 式 回归 模型 ， 

Y = k +Ar+Rr +e [4.6] 


该 模型 可 以 用 Y RKF Mr’ 的 线性 最 小 二 乘法 回归 拟 合 ,因为 其 系数 所、 有 、 
Bo 是 线性 的 。 假 设 我 们 对 回归 方程 达到 最 大 值 或 最 小 值 时 的 z 值 比 较 感 兴 
趣 [62] ,对 方程 4. 6 两 边 取 期 望 值 , 然 后 对 z 求 导 , 可 得 : 


dE(Y) _ 
-k h + 2Rx 

使 之 等 于 0, 解 方程 ,可 得 到 函数 为 最 小 值 (假如 是 正 的 ?或 者 最 大 值 时 (假如 
B 


xt = 


其 为 回归 系数 Bix f& 的 非 线性 函数 。 
要 运用 Delta 方法 ,我 们 需要 y = fe. Rk) = B/ (2B) 对 回归 系数 求 偏 
导数 : 
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现在 ,我 们 要 计算 B 、B 的 最 小 二 乘法 估计 BL. Be RHO VB.) AV (CB), 
还 有 它们 的 协 方差 (B, B), RAŽ, y 的 最 大 似 然 法 估计 为 放 = 
— B; /2B, 9 那么 sy 的 Delta 方法 方差 为 : 


o= ve-z) +0Bo (Fe) +26, Bo (— ge) (se) 


那么 ,y 的 95% 置 信 区 间 为 了 土 1.96 V CY). 
回归 模型 的 最 大 似 然 法 估计 
如 前 文 所 述 , 在 线性 模型 假设 下 ,y~N, (XB, ob)。 所 以 ,对 于 第 i 个 观测 ， 


Y;~N, (xB, P) FEP x, 为 模型 矩阵 X 的 第 ; 行 。 将 其 写成 方程 形式 ,可 知 第 i 
个 观测 的 概率 密度 为 : 





ee 1 (y: 一 Xp) 
PCy) 一 esp| 2g? | 


HF n PS HOLY ae oh We «LH 5 EE ATT DK Ea BR BE Hy a BE IIR AR 


2 1 DY oxp? 
(y) = 
sa ae 27 | 








1 / 
= 一 一 一 一 (y— XB) Cy — XP) 
Cro)” i y F xp | [4. T] 





虽然 这 个 方程 同样 遵循 y 的 多 元 正 态 分 布 ,但 是 从 p(y;) 到 p(y) 的 推导 过 程 有 
助 于 我 们 考虑 随机 回归 元 。 
从 方程 4.7 中 ,我 们 可 得 对 数 似 然 函 数 : 








log. L(p, °) =— log, 2r — log. o ey Xp)’ (y—Xp) [4.8] 


为 了 最 大 化 似 然 函 数 , 我 们 需要 求 方程 4.8 对 参数 及 o 的 偏 导数 。 当 我 们 注意 
到 (y 一 Xp)'(y 一 XP) 实际 上 是 误差 平方 和 时 , 求 导 过 程 会 变 得 简单 : 
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Ilog. L B, >) 
IB 








z7 X XB 2X y) 








Ilog. L (B, o Ly 1 / 
og EB, o (ry Xp) — Xp) 


Io" o 
让 偏 导数 等 于 0 并 解 方程 ,可 得 : 
B= (XX) X'y 


人 2 = (y— XB)’ (y— XB) _ ee 


n n 





RAKIA TEE B 和 最 小 二 乘法 估计 量 b 是 一 致 的 。 实 际 上 ,不 需要 正 
式 的 最 大 似 然 法 ,我 们 也 可 由 方程 4. 7 发 现 这 个 等 价 关 系 : 当 负 指 数 很 小 的 时 
候 , 似 然 度 会 很 大 , 且 指数 的 分 子 中 包含 了 误差 平方 和 。 因 此 ,最 小 化 残 差 平方 
和 等 价 于 最 大 化 似 然 度 。 

E? 的 最 大 似 然 估 计量 是 有 偏 的 ,因此 ,我 们 会 选择 如 前 所 述 的 类 似 且 无 偏 
的 估计 量 S 二 ee/(n 一 k 一 1) ,然而 , 随 着 的 增 大 ,57 的 偏差 越 来 越 趋 近 于 0, 
作为 一 个 最 大 似 然 法 估计 量 ,3? 是 一 致 的 。 
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本 章 中 ,我 们 进一步 发 展 了 线性 回归 分 析 理 论 , 它 不 再 局 限于 模型 矩阵 X 
是 固定 的 这 一 前 提 。 如 果 重 复 一 个 研究 ,我 们 希望 因 变量 y 能 变化 ,但 是 由 于 X 
是 固定 的 ,那么 在 重复 研究 中 , 自 变量 的 值 为 常数 。 这 种 情形 描述 了 实验 的 真 
实情 况 , 因 为 自 变量 是 由 研究 者 控制 的 。 然 而 对 于 大 多 数 的 社会 学 研究 ,数据 
都 是 观测 到 而 不 是 实验 控制 得 来 的 。 在 一 个 观测 研究 中 (例如 ,调查 研究 ) ,我 
们 一 般 会 在 重复 研究 中 得 到 不 同 的 解释 变量 。 所 以 ,在 观测 研究 中 ,X 是 随机 而 
非 固 定 的 。 

只 要 符合 某 些 条 件 , 线 性 回归 统计 学 理论 就 同样 适用 于 X 是 随机 的 情况 。 
对 于 固定 的 自 变量 ,其 前 提 假 设 为 gs 一 N,(0, czL), 即 所 有 模型 矩阵 的 离散 行 的 
误差 分 布 是 相同 的 。 当 X 为 随机 变量 时 ,我 们 需要 假设 这 个 性 质 对 于 样本 总 体 
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中 所 有 可 能 的 自 变 量 组 合 都 成 立 , 即 假设 X 和 e 是 独立 的 ,那么 ,样本 中 取 值 为 
e | X 的 自 变 量 误差 的 条 件 分 布 为 N, (0, PL), 不 管 选取 的 是 哪个 特定 样本 ， 
Mo = ig he 

因为 X 是 随机 的 ,所 以 它 存在 一 些 ( 多 元 ) 概 率 分 布 。 我 们 不 需要 对 这 些 分 
布 给 定 假设 ,但 是 我 们 有 如 下 要 求 :(1) 对 X 的 测定 不 存在 误差 , 且 X 和 s 是 独 
立 的 (如 前 所 述 );(2) 假 设 X 的 分 布 与 模型 回归 参数 pB、o 无 关 ; (3) 规 定 X 的 协 
方差 矩阵 是 非 奇 蜡 的 ( 即 在 总 体 中 没有 X 是 不 变 的 ,或 者 说 没有 一 个 X 是 其 他 
变量 的 完美 线性 函数 )。 我 们 不 用 假设 回归 元 (和 误差 相 比较 ) 是 正 态 分 布 的 ， 
这 样 会 好 很 多 ,因为 许多 X 是 非 正 态 的 ,如 虚拟 变量 和 多 项 式 变量 ,还 有 其 他 许 
多 定量 解释 变量 。[63] 

虽然 没 必 要 不 断 重复 ,但 是 我 会 指出 随机 解释 变量 在 新 假设 下 的 一 些 关 键 
结果 。 其 他 结果 可 以 此 类 推 。 

对 于 X 值 的 一 个 特定 样本 X, y 的 条 件 分 布 为 : 


E(y|X.)=EL(Xpte) |X ] 
=X, B+ ELe|X J 
=X.p 
那么 ,最 小 二 乘法 估计 量 的 条 件 期 望 均值 为 : 
E(b|X,)=EL(X X) !'X’y|X,] 
= (XX) TX, ELy| Xo J 
= (X5X)) X, Xp 
=$ 
因为 这 个 过 程 可 以 对 任意 X 进行 重复 ,所 以 最 小 二 乘 估计 量 b 对 于 任意 该 类 值 
都 是 条 件 无 偏 的 , 它 在 无 条 件 下 也 是 无 偏 的 , Eb) = B. 


现在 我 们 对 进行 统计 估计 。 具 体 来 说 ,想象 我 们 需要 计算 联合 零 假设 
H:A == =—% 二 0 的 p 值 。 因 为 当 X 为 固定 的 时 候 ,s | X ~ N,(0, l), 
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对 于 X=X AY p 值 是 正确 的 ( 即 对 于 正在 使 用 的 样本 )。 然 而 ,X 没有 什么 特 
别 之 处 ,误差 向 量 s 是 独立 于 X 的 ,所 以 对 于 任意 的 X，s 的 分 布 都 为 
N,(0, PL) 。 因 此 ,p 值 是 无 条 件 有 效 的 。 

最 后 ,我 要 指出 ,B、 的 最 大 似 然 估计 量 不 会 因 X 是 随机 的 而 改变 ,只 要 新 
的 假设 成 立 一 一 当 X 为 随机 变量 时 ,样本 观测 不 仅 包含 因 变量 (Y, ,，…,Y, ) ,而 
AAS BBE (x. x) ;我们 可 以 把 观测 记 为 [Yl ,xi]，…，[Y,, x, J. H 
于 这 些 观测 是 独立 采样 的 ,因此 它们 的 概率 密度 为 它们 的 边缘 密度 的 乘积 : 





ply; X) = plys xij» tán Lyno x D= p ’ x’) XK ‘eee X POs x.) 
第 i 次 观测 的 概率 密度 p(y;， x) TAER p(y;|x)p(x;)。 根 据 线 性 模型 ,给 
E x 的 y; 的 条 件 分 布 是 正 态 的 : 


/ 1 (yi —x py" 
(Cy: | x) = 
PCy: | | | 


20° 





那么 ,所 有 观测 的 联合 概率 密度 为 : 





1 (y; = 


ty, X) = Tl oes’) exp| 
ply Ile ee z 








. 7 1 (y — XB)’ (y — Xp) 
~ [ewo lael ` a =| 
= p(X) ply | X) 


只 要 p(X) 不 再 由 参数 p o 决定 ,我 们 就 可 以 在 最 大 化 p(y, X) 的 过 程 中 ,忽略 
X 的 联合 密度 。 最 后 ,对 于 固定 的 X, 最 大 似 然 估 计量 与 最 小 二 乘法 估计 量 
Bhs 
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注释 





[ 1] 我 们 可 以 为 长 方形 矩阵 定义 一 个 广义 的 逆 矩 阵 ,但 是 对 于 方形 矩阵 ,其 逆 矩 阵 不 合 常规 。 

[ 2 ] det A 的 另 一 种 常用 的 替换 表示 法 为 |A|。 

[ 3 ] 在 统计 问题 中 应 用 几何 向 量 , 尽 管 在 向 量 空间 的 维 数 通 常 与 样本 量 n 相等 ,我 们 仍 可 以 根据 我 们 

的 兴趣 将 子 空间 限制 到 二 维 或 者 三 维 。 

[4] 和 矩阵 XX 的 元 为 x’x) = x, + x), 其 中 ,x; Al x, 分 别 为 矩阵 X 的 第 i 列 和 第 j 列 。 类 似 地 ,XX 的 
第 i 个 对 角 元 为 XiX 二 X e Xio 

[5 ] 按照 常规 ,我 们 通常 定义 较 小 的 角 为 两 向 量 间 的 夹 角 (因此 ,该 角度 不 可 能 大 于 180°) , 记 做 w, AB 

么 较 大 的 角 则 为 360 一 w。 由 于 cos(360 一 w) = cos(w), 因此 ,这 样 定义 不 会 引起 歧义 。 

[6 ] 不 要 把 线性 方程 的 几何 表示 与 向 量 的 几何 表示 混淆 。 

[7 ] 有 关 术 语 的 说 明 :一些 作 者 不 论 方程 组 一 致 与 否 ,或 者 系数 和 矩阵 的 秩 多 少 ,一概 把 “方程 数目 大 于 

未 知 数 ” 的 方程 组 定义 为 “ 超 定 方程 组 ”, 把 “方程 数目 小 于 未 知 数 ” 的 方程 组 定义 为 “ 欠 定 方程 

组 ”。 我 认为 ,我 在 文中 的 论述 (Daivs，1973) 更 合适 些 。 

[8 ] 有 关 广 义 逆 矩 阵 在 统计 学 中 的 延伸 论述 ,请 参考 相关 著作 (Rao & Mitra, 1971). 

L9] 我 们 可 以 给 方程 1. 12 加 一 些 限 制 条 件 ,使 得 广义 逆 和 矩阵 变 得 唯一 。 比 如 ,Moore-Penrose 广义 道 

HE A 满足 4 个 条 件 : AA' A= A; AL AA'= Al; AA! 是 对 称 的 ;A' A 也 是 对 称 的 。 在 典型 的 

统计 应 用 中 ,广义 道 和 矩阵 非常 好 用 。 

[10] 首先 ,Ac 是 Ac 的 广义 道 矩阵 ;其 次 ,由 方程 1. 15 ,我们 知道 A= EAE’ ,那么 ， 


AA A= (E'A-E* (E'A E)E 'AE” 











= E'A- AACE’! 

=I Ack 

=A 
从 而 方程 成 立 。 

[11] 一 元 二 次 方程 回顾 :z 满足 方程 ; 
ar? + br +c =0 
其 中 ,ae、 和 * 为 指定 常数 ,那么 ， 
fas zh 


[12] 通过 解 特征 方程 求 特征 值 不 是 一 个 很 好 且 很 有 吸引 力 的 方法 ,还 有 一 些 比较 实际 的 求解 特征 值 
及 其 特征 向 量 的 方法 。 

L13] 对 于 一 个 对 称 正定 矩阵 ,我们 仍然 有 可 能 找到 其 Cholesky 因子 ,但 是 加 上 相应 行 中 的 其 他 元 素 ， 

和 矩阵 吕 会 有 一 个 或 多 个 对 角 元 素 为 0。 另外 ,为 了 解决 矩阵 U 对 角 元 素 的 问题 ,我 们 必须 取 正 平 

方 根 。 

L14] 牛 顿 声称 , 莱 布 尼 茨 穷 用 了 他 的 研究 成 果 , 从 而 引发 了 科学 史上 最 著名 的 争论 之 一 。 

L15] 在 有 些 数学 领域 ,自然 数 仅 指正 整数 。 

L16] 虽然 我 倾向 于 详细 地 标 出 对 数 的 底 , 如 logu, log. (除非 底 是 不 相关 的 , 标 出 log 已 经 足够 ), 但 是 

其 他 许多 学 者 喜欢 用 log 或 者 In 代替 自然 对 数 。 
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[17] 微 商 不 是 普通 的 数字 ,所 以 可 以 把 链 式 规 则 想象 成 同时 乘 以 和 除 以 一 个 引发 机 制 微 商 dz。 在 导 
数 中 引入 微 商 是 有 效 的 。 
[18] 超 平面 是 指 超出 三 维 空间 的 一 个 线性 ( 平 的 ) 表 面 。 超 平面 的 维度 比 总 空间 的 维度 少 1, 就 像 三 维 
空间 里 嵌入 的 一 个 二 维 对 象 。 
[19] 有 些 学 者 喜欢 加 入 约束 条 件 ,而 不 是 减 去 之 : 
Altis Zar °y Zas A) = fitis Drs Tn) TAK glis Tis aLa) 


但 是 ,除了 4 的 符号 发 生 改 变 以 外 ,这 两 种 方法 是 没有 差异 的 。 

[20] 如 果 对 于 任意 非 零 向 量 x, 有 X Hx > 0, 那么 我 们 说 方 阵 H( 这 里 是 海 森 矩阵 ) 是 正定 的 。 正 定海 
森 矩 阵 是 最 小 值 的 充分 非 必要 条 件 。 同 样 , 如 果 对 于 任意 非 零 向 量 x, 有 X' HX 一 0, 那么 我 们 说 
方 阵 也 (这 里 是 海 森 矩 阵 ) 是 负 定 的 。 负 定海 森 和 矩阵 是 最 大 值 的 充分 非 必 要 条 件 。 

[21] 非 零 整数 的 阶乘 定义 为 na! = 二 n(n 一 1)(n 一 2)…(2)(1)。 按照 惯例 , 0! = 1! = 1。 

[22] 这 种 近似 叫做 “ 穷 举 法 "(虽然 不 是 传统 的 极限 表示 ) ,被 古代 希腊 人 所 熟悉 。 

[23] 读者 可 以 证 明 F(z) 是 函数 f(z) 二 二 十 3 的 一 个 反 导 数 。 一 般 而 言 ,我 们 可 以 通过 反 过 来 应 用 知 

函数 的 导数 的 规则 ,进而 寻找 多 元 函数 的 反 导 数 。 

[24] 样本 空间 是 无 限 的 ,原因 在 于 可 能 需要 等 任意 足够 长 的 时 间 才 能 观测 到 第 一 次 出 现 硬币 正面 的 

情况 ,尽管 在 现实 中 等 待 无 限 长 时 间 的 概率 是 极 小 的 。 通 常 , 当 S 是 离散 且 无 限 的 时 候 , 我 们 称 

其 为 “可 数 无 穷 ”, 因 为 S 中 的 元 素 与 自然 数 0、1、2 等 一 一 对 应 。 

[25] 这 些 定理 类 似 于 (或 者 等 价 于 ) 那 些 由 20 世纪 俄国 数学 家 A. N. aR SEG HE CA. N. Kolmogorov) 
所 提出 的 定理 。 

[26] 如 果 随 机 变量 X 可 取 有 限 或 者 可 数 无 穷 多 的 不 同 值 ,那么 我 们 说 ,该 随机 变量 X 是 离散 的 。 

[27] 概率 通常 对 应 的 是 密度 函数 p(x) 下 的 区 域 ,随机 变量 X 的 某 一 特殊 值 xz, 下 的 区 域 一 一 一 条 与 
横 坐 标 年 直 的 线 , 其 概率 为 0。 

[28] 一 个 连续 随机 变量 X 的 概率 密度 函数 常常 表示 为 /(z) ,其 累积 分 布 函数 表示 为 下 (z) ,但 是 我 觉 
得 用 p(x) 和 p(x) 表示 更 好 ,因此 我 倾向 于 把 /(，) 留 作 他 用 ,比如 随机 变量 的 变换 。 

[29] 如 果 你 对 积分 不 是 十 分 熟悉 ,不 要 过 于 苛求 。 其 理解 的 关键 点 在 于 ,我 们 将 概率 密度 曲线 pa) 
以 下 的 区 域 解释 为 概率 ,累积 分 布 函 数 CDF P(z) 的 高 度 告诉 我 们 ,随机 变量 X 的 可 观测 值 小 于 
或 等 于 某 一 特殊 值 2 的 概率 。 积 分 符号 | 表示 连续 求 和 ,代表 了 曲线 以 下 的 区 域 。 

[30] 由 于 训 (z) 具 有 连续 性 ,再 加 上 PrCX = x) = Pr(X = 2.) = 0. 我们 不 需要 区 别 Pr(xo 寺 Xz) 

和 Pr(zo < X < rı). 

[31] 一 些 随机 变量 没有 定义 其 期 望 值 和 方差 ,在 这 里 ,我 忽略 了 这 一 可 能 性 。 

[32] 我 们 是 在 X 的 支持 下 整合 的 ,因此 不 需要 包含 整 条 实 线 。 

[33] 如 果 你 对 第 2 章 介绍 的 有 关 积 分 部 分 的 内 容 不 太 熟 悉 , 其 实 可 以 简单 地 把 积分 符号 | 看 做 求 和 

符号 >). 

[34] 这 里 用 希腊 字母 x 的 原因 在 于 ,概率 无 法 被 直接 观测 到 。 由 于 x 代表 概率 ,其 值 在 0 到 1 之 间 ， 

所 以 不 要 将 其 跟 数 学 常数 ~ 3. 1416 混淆 。 

[35] 回忆 一 下 有 关 阶 乘 运 算 的 法 则 : 

nl=nX (n—1) X…-X2X1 (mn 为 任意 大 于 1 的 整数 ) 
=1(n 等 于 0 或 1) 
[36] 一 些 作者 会 用 N o) 来 代表 正 态 分 布 , 该 表达 用 正 态 分 布 的 标准 方差 代替 了 我 们 所 用 的 方差 。 
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[37] 任意 存在 有 限 均值 和 方差 的 随机 变量 都 可 以 标准 化 为 均值 为 0 方差 为 1 的 随机 变量 。 但 是 标准 
化 对 分 布 的 形状 并 无 影响 ,尤其 是 , 它 不 会 把 一 个 不 是 正 态 分 布 的 变量 变 为 正 态 分 布 的 变量 。 

[38] 小 写字 母 1 是 一 个 通用 表示 方法 。 

[39] 4n= 1 时 ,E(z) 的 期 望 值 不 存在 ,但 是 1 的 中 位 数 和 众 数 仍 为 0。z 被 称 为 “ 柯 西 分 布 ”(Cauchy 
distribution) , 它 是 以 19 世纪 法 国 数学 家 奥古斯丁 * 路 易 斯 * 柯 西 命名 的 。 

[40] 将 命题 反 过 来 则 为 假 :随机 向 量 x 所 包含 的 元 素 的 边缘 分 布 是 单 因素 正 态 分 布 ,不 一 定 为 多 元 正 
态 分 布 。 

[41] 把 (pi, Ps，…，p,，…} 说 成 非 随机 序列 不 会 有 明显 的 矛盾 ,虽然 这 些 概 率 建立 在 随机 变量 上 ,但 
是 概率 本 身 是 特定 的 数字 一 一 如 0.6、0. 9 等 等 。 

[42] 用 渐 近 分 布 定义 渐 近 期 望 值 和 方差 更 具 吸 引力 ,因为 这 个 目的 的 序列 不 是 在 所 有 情况 下 都 存在 
的 (Theil，1971: 375—376; McCallum,，1973)。 我 所 用 的 渐 近 期 望 和 方差 的 符号 一 一 e(，。) 和 
v(。) 一 一 不 是 标准 化 的 ,读者 应 该 注意 ,这 些 符号 有 时 会 被 普通 期 望 值 和 方差 的 符号 一 一 E(， ) 
和 V(，。) 一 一 所 替代 。 

[43] 有 关 统 计 估 计 的 大 部 分 材料 以 及 这 本 书 的 相关 内 容 均 来 自费 舍 尔 (Fisher，1992) 的 一 篇 论文 ,该 
论文 被 誉 为 20 世纪 最 重要 的 统计 论文 之 一 (Aldrich, 1997)。 

[44] 如 果 没 有 强调 对 称 性 ,我 们 所 说 的 中 心 概念 就 会 变 得 很 模糊 。 

[45] 严格 来 说 ,pav 的 导数 没有 定义 EE = 0 时 的 情况 , 但 为 方便 起 见 ,我 们 将 EE = 0 的 情况 设 定 为 
gav (0) = 0。 

[46] 可 以 写成 该 形式 的 估计 值 可 以 看 成 最 大 似 然 估 计 值 的 广义 形式 ,因此 ,也 被 称 为 “M 估计 值 "。 最 大 
似 然 估 计量 是 通过 对 合适 的 概率 函数 或 者 概率 密度 函数 p(，) 进 行 变 换 p(x 一 jy) = 
— log, p(x 一 py) 得 来 的 。 

[47] 我 所 用 的 命名 不 太 严格 ,只 是 比较 方便 而 已 。 严 格 地 说 ,y 函数 不 是 一 个 影响 函数 ,只 是 其 形状 

与 影响 函数 相同 。 

[48]“ 双 平方 "常常 应 用 在 y 函数 和 权重 函数 上 (因此 称 为 “ 双 权 ”), 它 是 近期 才 出 现 的 统计 词汇 ,但 是 

作为 目标 函数 却 不 是 。 

[49] 因为 一 个 重新 降级 过 的 M 估计 值 的 估计 方程 (如 双 平 方 ) 可 以 有 多 于 一 个 的 平方 根 ,所 以 选择 初 
始 估计 便 成 为 必然 。 

[50] 似 然 函数 是 n 取 值 在 0 和 1 之 间 的 连续 函数 。 此 例 与 概率 函数 的 不 同 之 处 是 , 它 所 有 可 能 的 样 
本 是 有 限 的 ,为 2"。 

[51] 严格 地 说 ,Fisher 信息 是 参数 值 为 a 时 所 估计 记分 的 方差 : 


Ko=E| (FLW) a] 


在 许多 情况 下 ,该 方程 与 文中 提 及 的 方程 等 价 ,但 是 相对 复杂 和 麻烦 。 请 注意 ,记分 的 方差 仅 是 
其 平方 的 期 望 值 ,因为 在 a 时 ,其 期 望 记分 为 0。 
[52] 在 观测 信息 上 建立 MLE@ 的 方差 估计 值 是 可 能 的 ,而 且 更 方便 计算 。 











clog.L (人 ) 


1 (@)= dé 


[53] 我 们 说 参数 是 独立 的 ,意思 是 空 值 可 以 从 其 他 参数 取 值得 到 。 如 果 参 数 间 存 在 依附 关系 ,那么 多 
余 的 参数 就 会 通过 一 个 函数 被 其 他 参数 所 替代 。 
[54] 在 单一 参数 的 例子 中 ,Fisher 信息 更 广义 的 定义 为 : 
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Ka) =E| (“oe L ) [a] 


同样 ,我 们 可 以 通过 用 MLE& 时 的 观测 信息 来 进行 研究 。 

[55] 要 利用 贝 叶 斯 推断 , 先 验 想法 必须 符合 概率 论 ,所 有 先 验 概率 的 和 必须 为 1 。 

[56] 在 这 种 情况 下 , 先 验 是 一 个 长 方形 密度 函数 ,其 参数 x 被 限制 在 0 到 1 之 间 。 例 如 ,估计 正 态 分 
布 的 均值 pe 不 存在 界 域 问 题 ,那么 它 在 一 号 二 y 二 的 扁平 先 验 形 式 p(y) = c 不 存在 一 个 有 限 
概率 ,因此 无 法 代表 密度 函数 。 当 它 和 似 然 函数 合并 后 ,例如 成 为 一 个 不 正常 先 验 , 还 是 会 导致 

-个 正常 后 验 分 布 一 一 一 个 积分 为 1 的 后 验 分 布 。 还 有 ,一 个 概率 模型 的 参数 化 扁平 先 验 对 于 
一 个 可 替换 参数 化 方案 来 说 并 不 扁平 。 假 设 我 们 取 发 生 比 w 夺 x/(1 一 x) 作为 参数 ,其 等 价 的 对 
数 形式 为 4 三 log.[x/(1 一 x)] o m 的 扁平 先 验 对 w ALA 都 是 不 扁平 的 。 

[57] 一 个 替代 方法 是 把 后 验 分 布 的 均值 作为 x 的 点 估计 。 然而 在 大 多 数 情 况 下 , 随 着 样本 量 的 不 断 

增加 ,后 验 分 布 会 越 来 越 趋 近 正 态 分 布 ,那么 ,如 果 样 本 量 足 够 大 ,其 众 数 和 均值 是 几乎 相等 的 。 

[58] 该 规则 有 个 例外 , 即 对 于 某 些 参 数值 , 先 验 分 布 为 零 密度 分 布 ,那么 ,对 于 这 些 参数 值 , 其 后 验 分 
布 也 会 是 零 密度 分 布 。 

[59] 一 般 而 言 , 独 立意 味 着 不 相关 ,但 是 不 相关 的 随机 变量 不 一 定 是 独立 的 。 但 是 ,在 多 元 正 态 分 布 
中 ,独立 和 不 相关 是 等 价 的 。 

[60] 关于 这 段 所 提 到 的 结果 的 证 明 ,可 参见 相关 著作 (Rao, 1973). 

[61] 为 了 使 假设 可 行 ,两 个 解释 变量 x, 、zz 必须 用 相同 的 单位 来 衡量 。 

[62] Delta 方 法 在 这 个 问题 上 的 应 用 是 由 威 姿 伯 格 (Weisberg,，2005) 提 议 的 。 

[63] 前 面 的 结果 对 于 新 假设 下 的 X 是 适用 的 ,但 并 不 代表 这 些 假设 是 完全 没有 问题 的 。 许 多 解释 变 
量 都 是 有 测量 误差 的 , 且 在 某 些 条 件 下 ,它们 会 使 估计 系数 有 严重 的 偏差 。 同 样 ,在 特定 的 (一 般 
的 ) 回 归 等 式 理解 中 ,关于 解释 变量 误差 独立 的 假设 等 价 于 模型 中 包含 的 Y 的 决定 因素 和 忽略 因 
素 是 不 相关 的 。 最 后 ,线性 假设 、 常 误差 方差 和 正 态 都 是 有 潜在 问题 的 。 能 令 人 满意 地 处 理 好 这 
些 问题 ,与 回归 分 析 作 为 数学 抽象 和 数据 分 析 的 实用 工具 是 不 一 样 的 。 
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Fisher information Fisher 信息 
fitted value 拟 合 值 
fractional powers 分 数 赛 函 数 
Gaussian elimination 高 斯 消去 法 
hazard 风险 

Hessian matrix AE 
homogeneous system of equations 齐 次 方程 组 
hyperplane 超 平面 
idempotent FEJL 
identity matrix 单位 矩阵 
influence function 影响 函数 
inner product AR 

integer 整数 
irrational number 无 理 数 
Jacobian of the transformation HEAR 
joint probability distribution 联合 概率 分 布 
jointly sufficient statistics 联合 充分 统计 量 
Lagrange-multiplier test PLB RA 
latent growth curve model 潜在 增长 曲线 模型 
latent root 潜伏 根 
least-absolute values 最 小 绝对 值 
limit 极限 

limit of integration 积分 域 

linear simultaneous equation 线性 联 立方 程 
log-odds 对 数 优 比 
lower-triangular matrix FS Ane 
marginal posterior distribution 边缘 后 验 分 布 
marginal probability distribution 边缘 概率 分 布 
marginal probability density 边缘 概率 密度 
matrices of cross-products 交叉 乘积 矩阵 
matrices of sums of squares 平方 和 和 矩阵 
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regression sum of squares 
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sampling distribution 
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scalar constant 
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scale parameter 
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尽管 莱 布 尼 效 和 和 牛顿 早 在 17 世纪 就 创立 了 微分 方程 ,但 微分 方程 在 社会 科学 中 的 
应 用 却 滞后 了 很 久 。 例 如 ,马尔 萨 斯 利用 一 个 常 微分 方程 得 到 人 口 增长 模型 ,dp/ dt = 
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模型 中 , 还 被 社会 学 家 肯 尼 斯 * = (Keneth Land) 应 用 到 涂 尔 干 社会 劳动 分 工 
(Durkheimian division of labor in society) 的 数学 模型 以 及 许多 其 他 现象 的 分 析 中 ,例如 ， 
社会 .文化 和 科技 传播 及 流言 的 散布 的 分 析 。 

布朗 不 仅 为 数学 和 统计 学 拓展 了 一 个 主题 ,而 且 向 社会 学 家 提出 了 新 的 挑战 , 希 


望 社会 学 家 能 走出 以 变量 为 取向 的 思维 定 势 ,更 多 地 从 过 程 的 角度 来 思考 问题 , 因为 
对 过 程 的 理解 毫 无 疑问 是 正确 理解 人 类 的 政治 .心理 和 社会 行为 至 关 重 要 的 一 个 
环节 。 
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人 类 生活 在 持续 的 时 间 里 ,所 有 社会 现象 的 发 生 都 是 连续 的 。 微 分 方程 正 
是 模拟 这 种 随时 间 推 移 而 连续 发 生 的 变化 。 微 分 方程 在 模拟 社会 和 政治 变迁 
上 的 广泛 应 用 能 开启 社会 科学 前 沿 研究 的 新 局 面 。 

在 物理 和 自然 科学 领域 ,科学 家 们 常常 用 微分 方程 来 模拟 各 种 现象 的 变 
迁 。 这 样 做 的 原因 并 不 是 他 们 所 研究 的 现象 呈现 出 来 的 变化 过 程 非常 独特 以 
及 社会 和 政治 变迁 存在 本 质 差 异 。 例 如 ,化 学 反应 中 的 传染 和 扩散 过 程 与 社会 
现象 呈现 出 来 的 过 程 类 似 。 更 确切 地 说 ,物理 学 家 和 自然 科学 家 使 用 微分 方程 
是 因为 想 用 这 些 模型 来 更 好 地 模拟 在 真实 世界 中 发 生 的 现象 随时 间 连 续 变 化 
的 本 质 。 也 就 是 说 ,这 些 现象 本 身 要 求 使 用 微分 方程 。 

社会 科学 家 也 研究 变迁 , 且 有 几 个 非常 值得 注意 的 .用 微分 方程 来 模拟 社 
会 变迁 过 程 的 例子 。 这 些 有 巨大 影响 的 例子 已 经 成 为 现 有 社会 科学 文献 中 经 
典 的 理论 思考 典范 。 路 易 斯 。 弗 莱 ， 理 查 和 森 的 军备 竞赛 模型 就 是 其 中 的 一 个 
例子 。 

然而 ,微分 方程 在 社会 科学 中 的 应 用 程度 远 没 有 自然 科学 和 物理 科学 中 那 
么 广泛 。 这 主要 由 两 方面 原因 造成 :一 方面 源 自 理论 , 另 一 方面 源 自传 统 。 从 
理论 角度 来 讲 , 社 会 科学 中 大 量 早 期 的 经 验 研 究 都 建立 在 20 世纪 50 年 代 出 现 
的 人 口 调查 的 基础 上 (Berelson，Lazarsfeld & McPhee, 1954; Campbell, Con- 
verse, Miller & Stokes, 1960)。 研 究 人 员 利 用 交叉 表 和 各 种 相关 分 析 技 术 来 
分 析 这 些 调查 数据 。 这 些 早期 的 经 验 研 究 极 大 地 促进 了 人 们 对 社会 和 社会 变 
迁 过 程 的 理解 。 这 些 研 究 方法 的 应 用 最 终 导 致 了 回归 模型 在 现 有 社会 科学 经 
验 研究 文献 中 占 主导 的 局 面 。 基 于 这 些 理论 方面 的 原因 ,社会 科学 家 一 直 被 培 
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训 使 用 统计 模型 而 不 是 微分 方程 模型 。 专 注 于 统计 模型 的 训练 现在 已 成 为 常 
规 应 用 社会 科学 方法 发 展 的 历史 传统 。 但 是 ,考虑 到 许多 社会 和 政治 变迁 过 程 
实际 上 是 连续 发 生 的 ,因此 ,如 果 社 会 科学 家 更 常用 连续 时 间 模 型 来 模拟 所 研 
究 的 变迁 的 动态 结构 ,那么 ,社会 科学 中 将 会 涌现 出 很 多 重要 的 新 发 现 ,这 样 的 
假定 是 非常 符合 逻辑 的 。 

本 书 的 主要 目的 之 一 ,是 把 微分 方程 建 模 介 绍 给 社会 科学 中 的 更 多 研究 人 
员 。 而 且 , 我 也 期 望 社会 科学 家 能 增加 微分 方程 在 社会 和 政治 变迁 建 模 中 的 应 
用 ,这 种 应 用 能 开拓 社会 科学 家 新 的 理论 思考 方式 ,这 种 理论 思考 方式 将 导致 
一 些 新 发 现 。 同 时 值得 注意 的 是 ,一 套 源 于 系统 理论 的 理论 构建 图 示 法 的 存 
在 ,能 协助 社会 科学 家 生成 微分 方程 模型 ,从 而 帮助 他 们 理解 理论 的 高 度 复杂 
性 和 精密 程度 (Brown，2008; Cortés, Przeworski & Sprague, 1974), 

也 许 很 多 社会 科学 家 会 问 ,相对 于 其 他 方法 ,微分 方程 在 研究 社会 变迁 时 
存在 什么 优势 呢 ? 各 种 变迁 一 般 都 可 以 用 微分 方程 和 差分 方程 这 两 种 模型 来 
表示 。 两 种 模型 的 区 别 在 于 ,微分 方程 以 连续 的 方式 模拟 变化 , 而 差分 方程 以 
离散 的 方式 模拟 变化 。 除 了 这 一 点 之 外 ,微分 方程 和 差分 方程 的 相似 性 远大 于 
其 异 质 性 。 因 此 ,虽然 微分 方程 和 差分 方程 的 处 理 机 制 不 同 , 但 是 本 书 中 的 很 
多 概念 仍 能 用 于 差分 方程 的 研究 。 虽 然 微分 方程 和 差分 方程 都 可 用 于 除 时 间 
之 外 的 自 变量 ,但 是 由 于 这 些 方程 主要 用 于 有 关 时 间 的 变化 ,所 以 本 书 将 集中 
讨论 这 种 用 法 。 在 讨论 微分 方程 之 前 ,值得 花 些 时 间 说 明 ,为 什么 社会 科学 家 
最 初 会 想到 使 用 微分 方程 。 


微分 方程 在 社会 科学 中 应 用 的 理论 依据 


相对 于 微分 方程 模型 ,社会 科学 家 更 常用 统计 模型 。 但 我 们 并 不 能 因此 断 
言 , 统 计 模型 优 于 微分 方程 模型 ,反之 亦 然 。 每 一 种 建 模 的 方法 都 有 其 自身 的 
优 缺点 。 统 计 模型 非常 适合 检验 实证 理论 ,尤其 适合 试图 通过 使 用 相关 分 析 方 
法 来 确认 变量 之 间 的 因果 关系 。 因 此 , 当 我 们 想 知道 用 于 阅读 的 时 间 是 否 提 高 
阅读 理解 的 考试 分 数 时 ,我 们 可 以 选择 一 个 联系 这 两 个 变量 的 统计 模型 。 但 
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是 ,也 存在 这 样 的 情形 , 即 虽然 微分 方程 模型 可 能 更 适用 或 更 有 意思 ,社会 科学 
家 却 倾向 于 使 用 统计 模型 ,这 样 做 也 是 有 原因 的 。 应 用 很 多 统计 模型 就 像 ^ 从 
箱子 里 取 东 西 "。 统 计 模型 的 应 用 如 此 便利 ,在 一 定 程度 上 可 能 促使 一 些 社会 
科学 家 避 开 使 用 ,甚至 不 考虑 更 有 趣 的 、 非 线性 确定 性 的 动态 模型 ,尤其 是 连续 
时 间 模 型 。 

使 用 微分 方程 模型 最 重要 的 原因 之 一 是 构建 理论 。 社 学 科学 家 可 以 使 用 
微分 方程 来 构建 关于 社会 政治 现象 的 理论 ,这 些 理论 能 详细 说 明 随 着 时 间 变 化 
的 具体 过 程 。 当 然 ,也 可 能 有 人 说 ,统计 模型 也 可 以 用 来 构建 社会 理论 ,而 且 确 
实 存在 这 种 情形 。 但 一 般 而 言 ,统计 模型 更 多 地 被 函数 形式 所 限制 ,在 一 定 程 
度 上 与 微分 方程 大 相 径 庭 。 统 计 模型 之 所 以 如 此 ,有 其 重要 的 实践 原因 。 统 计 
模型 必须 适用 于 许多 实证 情形 ,因此 在 任何 实证 检验 之 前 ,都 需要 完全 以 可 编 
程 的 公式 形式 来 弄 清 这 些 模 型 的 分 析 解 。 这 种 要 求 使 得 大 部 分 统计 模型 使 用 
已 有 的 方程 式 , 因 为 这 些 方 程式 的 概率 已 知 且 易于 驾驭, 我 在 后 面 将 具体 说 明 
这 个 问题 。 而 微分 方程 模型 通常 不 受 这 种 要 求 的 限制 。 实 际 上 ,使 用 微分 方程 
时 ,一 个 模型 的 建构 仅仅 受 限 于 研究 人 员 在 社会 理论 上 的 创造 力 。 由 于 数学 理 
论 和 计算 科学 的 发 展 ,现在 ,一 个 研究 人 员 可 以 借助 微分 方程 模型 提出 前 所 未 
有 的 、 复 杂 巧 妙 的 社会 政治 理论 。 

近来 , 越 来 越 多 的 社会 科学 家 使 用 微分 方程 来 模拟 社会 现象 ,这 些 尝 试 的 
广度 和 深度 可 以 通过 一 些 实例 来 说 明 。 在 社会 科学 中 使 用 微分 方程 模型 的 一 
些 经 典 例 子 包 括 西蒙 (Simon, 1957) 、 科 尔 曼 (Coleman，1964) 和 拉 波 波 特 (Rap- 
oport，1983) 的 经 典 讨 论 。 在 国际 关系 领域 , 理 查 森 (1960) 将 微分 方程 模型 应 
用 于 军备 竞赛 的 经 典 分 析 被 其 他 学 者 广泛 引用 。 普 齐 沃 斯 奇 (Przeworski) MR 
尔 斯 (Soares)(1971) 探 索 了 很 多 使 用 微分 方程 来 处 理 阶级 意识 和 左 辟 分 子 投票 
之 间 的 动态 过 程 。 图 马 (Tuma) 和 汉 南 (Hannan)(1984) 从 社会 学 视角 讨论 了 很 
多 使 用 微分 方程 系统 研究 社会 动态 过 程 的 方法 。 戈 特 曼 (Gottman) 、 默 里 (Mur- 
ray) HER (Swanson) 、 泰 森 (Tyson) 同 时 运用 微分 方程 和 差分 方程 来 考察 婚 
姻 的 心理 动态 过 程 。 卡 德 拉 (Kadera，2001) 利 用 微分 方程 来 分 析 州 际 政治 竞 
赛 ,并 因此 获奖 。 布 朗 (Brown，1994、1995a) 利 用 微分 方程 来 模拟 开发 或 保护 
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环境 的 决策 对 环境 恶化 的 影响 。 当 利用 美国 和 魏 玛 共和 国 选举 的 调查 和 合成 
数据 时 ,布朗 (1986b、1988、1991、1993、1995a) 也 使 用 微分 方程 来 重 现 两 国 选 
举 中 不 同 的 党 派 斗争 过 程 (这 也 称 为 “边界 值 问题 ” 。 

在 通常 情况 下 ,研究 人 员 想 生成 一 个 能 连续 界定 时 间 的 模型 有 很 多 理由 。 
因为 数据 的 收集 存在 间隔 ,所 以 社会 科学 家 经 常 以 离散 时 间 的 方式 来 思考 问 
题 。 例 如 ,普查 数据 一 般 每 10 年 收集 一 次 ,选举 数据 每 几 年 收集 一 次 。 但 是 , 许 
多 变迁 过 程 在 本 质 上 是 连续 的 ,因此 ,存在 一 些 情形 需要 社会 科学 家 利用 微分 
方程 来 模拟 这 类 社会 变迁 过 程 。 这 需要 社会 科学 家 们 重视 一 个 事实 , 即 出 于 便 
利 的 考虑 ,这 个 连续 过 程 可 能 被 分 段 进行 测量 。 在 这 种 情形 下 ,使 用 微分 方程 
来 模拟 一 个 连续 变化 过 程 ,有 时 可 能 完全 偏离 事情 发 生变 化 的 真实 时 点 ,进而 
影响 对 所 调查 事件 的 理解 。 


一 个 实例 


下 面 将 通过 一 个 例子 来 介绍 微分 方程 ,这 个 例子 展示 了 微分 方程 的 强大 ， 
即便 利用 一 个 简单 的 微分 方程 ,也 能 处 理 复杂 的 社会 理论 。 如 今 , 全 球 变 暖 的 
问题 受到 广泛 关注 。 二 氧化 碳 和 其 他 温室 气体 通过 人 类 行为 排放 到 大 气 中 。 
全 球 变 暖 潜在 地 改变 了 人 类 文明 不 面临 高 难度 挑战 而 持续 发 展 的 能 力 。 实 际 
上 ,如 果 全 球 变 暖 如 很 多 科学 家 声称 的 那样 持续 下 去 ,我 们 将 面临 很 多 临海 城 
市 由 于 海平 面 升 高 而 不 得 不 撤离 人 口 的 情形 。 想 象 一 下 ,以 后 去 纽约 的 第 五 大 
道 旅游 的 唯一 方式 是 通过 独 木 舟 或 潜水 装备 。 一 旦 华盛顿 被 淹没 ,那么 美国 的 
首都 将 迁 到 哪里 呢 ? 如 果 美 国 的 首都 迁 到 亚特兰大 (高 出 海平 面 304. 8 米 ), 亚 
特 兰 大 的 居民 是 否 像 现在 华盛顿 的 居民 那样 ,失去 了 他 们 在 国会 中 投票 权 呢 ? 
伴随 着 温度 的 升 高 和 海平 面 的 上 升 ,全 球 气候 会 发 生 什么 变化 呢 ?” 当 气候 恶化 
时 ,我 们 赖 以 生存 的 庄稼 会 怎样 呢 ? 全 球 变 暖 的 可 能 后 果 如 气候 变 冷 一 样 无 穷 
无 尽 。 这 些 有 趣 的 问题 即 下 面 微分 方程 模型 实例 的 研究 动机 。 

阿 纳 托 尔 。 拉 波 波 特 (1983:86 一 91) 在 研究 污染 恶化 及 其 对 人 类 数量 和 生 
活 质 量 的 影响 时 ,提出 了 下 面 的 模型 。 拉 波 波 特 也 利用 这 个 模型 延伸 了 由 杰 
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Gt + W. 福 里 斯 特 (Jay W. Forrester) (1971) 发 起 的 前 沿 性 的 同类 理论 研讨 。 
我 们 把 温室 气体 视 为 污染 的 一 种 形式 ,用 变量 已 来 表示 污染 的 水 平 (这 里 ,我 
使 用 拉 波 波 特 文中 用 到 的 数学 符号 )。 我 们 感 兴趣 的 是 模拟 这 个 变量 随时 间 
变化 的 过 程 。 一 种 方法 是 ,简单 假设 这 种 污染 物 以 固定 的 速率 排放 到 大 气 
中 。 从 这 个 假设 得 出 的 模型 比较 保守 ,因为 污染 物 的 排放 率 实际 上 会 随 着 人 
类 工业 活动 的 日 益 增加 而 增加 。 但 是 ,即使 利用 这 个 保守 的 假设 , 拉 波 波 特 
的 模型 也 发 现 了 令 人 惊讶 的 结果 。 我 们 可 以 把 这 个 固定 的 排放 率 写成 温室 气 
体 水 平 的 变化 率 ， 
dP/dt = I 

其 中 ,1 表示 污染 物 的 固定 排放 率 。 

但 是 ,二 氧化 碳 并 不 是 排放 到 大 气 中 就 一 直 不 发 生变 化 ,而 是 最 终 被 植物 
吸收 。 因 此 ,我 们 需要 在 我 们 的 模型 中 加 入 一 些 减少 温室 污染 水 平 的 方法 。 最 
直接 的 方法 是 减少 的 速率 将 和 污染 水 平成 一 定 比例 。 因 此 ,当空 气 中 的 二 氧化 
碳 比例 升 高 时 ,植物 也 会 吸收 更 多 的 二 氧化 碳 , 这 是 因为 二 氧化 碳 的 浓度 增加 
有 助 于 植物 的 增长 。 用 数学 公式 可 以 表示 为 : 


dP/dt = I—aP 


其 中 ,a 是 个 常数 ,一 aP 表示 大 气 中 因 被 植物 吸收 而 减少 的 二 氧化 碳 。 

这 个 模型 存在 一 个 均衡 点 ,也 就 是 说 , 当 dP/dt = 0 R I = aP 时 ,污染 物 的 
增加 将 停止 。 因 此 , 当 污 染 水 平 增长 时 ,植物 的 吸收 率 aP 将 最 终 等 于 污染 物 的 
排放 率 工 ,总 体 污 染 的 增长 将 停止 。 但 现实 情况 是 这 样 吗 ? 大 气 中 二 氧化 碳水 
平 的 增加 也 可 能 是 抑制 植物 增长 的 行为 造成 的 。 例 如 ,在 二 氧化 碳 增加 的 同 
时 ,砍伐 森林 的 工业 活动 也 增加 。 这 种 伴随 出 现 的 人 类 行为 也 可 能 导致 其 他 形 
式 的 污染 ,而 这 同样 也 会 引起 植被 破坏 。 

由 于 附属 效应 的 存在 ,我 们 可 以 看 出 ,二 氧化 碳水 平 的 减少 率 并 不 和 污染 
KF 忆 成 简单 的 比例 关系 。 相 反 ,我 们 将 假设 a 不 再 是 常数 ,而 是 随 着 PEH 
增加 而 减少 的 值 。 我 们 可 以 用 公式 来 描述 参数 a 降低 空气 中 二 氧化 碳水 平 的 
弱化 效应 a = ae, 其 中 ,ao 是 这 个 参数 的 初始 值 (如 了 P = 0), k 是 一 个 常数 。 
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从 中 可 以 看 出 , 当 己 值 增加 时 ,e ”的 值 渐渐 趋 近 于 0。 此 时 , 拉 波 波 特 的 污染 
模型 可 以 写成 如 下 形式 : 
dP /dt = I—a,Pe* 


从 中 可 以 看 出 ,污染 物 的 增长 率 工 将 导致 己 的 增加 ,aoP 将 渐渐 减缓 前 述 模型 中 
的 增长 量 。 但 当 己 持续 增加 时 ,e “将 发 挥 越 来 越 重要 的 作用 ,描述 由 植物 吸收 
的 二 氧化 碳 污染 的 减少 项 (一 coPe “) 将 趋 近 于 0, 此 时 只 剩 下 增长 率 工 这 一 项 
这 将 导致 污染 无 限 增 加 ,最 终 引 发 地 球 灾难 。 这 里 最 关键 的 问题 是 ,我 们 要 认 
识 到 ,从 这 个 简单 模型 中 得 到 的 结论 有 大 量 的 现实 意义 。 充 分 理解 这 个 模型 能 
帮助 我 们 以 深入 的 新 方式 来 更 严肃 地 思考 全 球 变 暧 问题 。 

就 分 析 拉 波 波 特 污染 模型 而 言 ,还 有 很 多 可 以 探索 的 问题 。 然 而 ,前 面 简 
短 的 讨论 足以 清晰 地 表明 ,微分 方程 能 描述 非常 复杂 微妙 的 理论 想法 。 上 述 的 
微分 方程 模型 从 理论 上 丰富 了 我 们 对 于 全 球 变 暖 问题 的 复杂 动态 过 程 的 理解 。 
我 们 很 难 想象 用 线性 回归 模型 来 处 理 同样 的 问题 。 然 而 ,线性 回归 模型 能 用 于 
处 理 有 关 全 球 变 暖 的 其 他 问题 ,如 研究 二 氧化 碳水 平和 和 气温 升 高 之 间 的 相关 关 
系 ,而 且 这 也 是 全 球 变 暖 问题 一 个 非常 重要 的 研究 方面 。 因 此 , 当 我 们 使 用 微 
分 方程 时 ,我 们 并 不 是 极力 贬低 统计 模型 的 重要 性 。 实 际 上 ,我 所 认识 的 所 有 
社会 科学 家 通常 两 种 模型 都 会 用 。 但 是 ,使 用 微分 方程 促成 理论 构建 的 想法 是 
使 用 微分 方程 建 模 的 一 个 特点 。 我 们 也 应 该 注意 到 ,微分 方程 模型 的 参数 估计 
是 完全 可 行 的 ,这 很 好 地 弥补 了 统计 模型 的 不 足 。 


微分 方程 在 自然 科学 和 物理 学 中 的 应 用 


虽然 本 书 的 重点 是 介绍 微分 方程 在 社会 科学 中 的 应 用 ,但 这 种 确定 性 模型 

一 直 是 数学 分 析 在 自然 科学 和 物理 学 应 用 中 的 主流 ,在 此 很 值得 简单 介绍 此 类 
应 用 。 在 自然 科学 中 ,微分 方程 被 广泛 应 用 于 群体 生物 学 中 ,以 研究 生态 系统 
中 不 同 物种 之 间 的 互动 (May，1974) ,例如 , 洛 特 卡 (1925) 和 沃 尔 泰 拉 (1931) 提 
出 的 著名 的 猎 食 者 一 猎物 方程 。 从 代数 学 角度 来 说 ,微分 方程 在 生物 学 中 的 应 
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用 在 很 多 方面 类 似 于 它 在 流行 病 学 中 的 应 用 。 流 行 病 学 基本 上 关注 疾病 的 传 
播 。 传染 性 疾病 的 许多 传播 扩散 机 制 能 用 微分 方程 来 建 模 。 微 分 方程 也 适用 
于 分 析 疾 病 传播 的 季节 性 和 其 他 周期 性 问题 。 

在 物理 学 中 ,微分 方程 的 广泛 应 用 可 以 追溯 到 牛顿 。 实 际 上 ,牛顿 第 二 定 
律 就 是 一 个 二 阶 微分 方程 , 即 力 等 于 物体 的 质量 和 加 速度 的 乘积 (F = ma) 
为 速度 是 一 阶 导 数 ,而 加 速度 是 速度 的 导数 )。 这 类 微分 方程 模型 大 部 分 是 确 
定性 的 。 

有 趣 的 是 ,自然 科学 家 和 物理 学 家 正在 扩大 以 前 主要 用 于 社会 科学 的 概率 
统计 模型 的 使 用 ,这 是 否 意味 着 确定 性 模型 正 逐 渐 失 去 它 的 用 武之 地 呢 ? 例 
如 ,量子 力学 的 新 发 现 促使 很 多 物理 学 家 从 概率 统计 的 角度 看 问题 ,他 们 已 经 
意识 到 ,量子 现象 基本 上 是 以 一 定 的 概率 存在 于 自然 中 。 这 可 以 追溯 到 约翰 。 
贝尔 (John Bell) 提 出 的 著名 定律 , 它 有 助 于 决定 爱 因 斯 坦 (Einstein) KA RI 
凯 (Podolsky) 、 罗 森 (Rosen) 和 尼 尔 斯 。 波 尔 (Neils Bohr) 的 争论 是 否 真 正 得 到 
最 终 的 解决 (Aczel,，2001) 。 直 到 20 世纪 八 九 十 年 代 , 被 称 为 “量子 纠缠 ”现象 
的 实验 结果 明确 地 证 明 , 爱 因 斯 坦 关于 量子 宇宙 基本 上 是 确定 性 的 观点 是 不 正 
确 的 ,而 且 没 有 任何 潜在 的 局 部 变量 能 解释 这 种 纠缠 现象 。 因 此 ,量子 现象 进 
一 步 强调 了 应 用 概率 统计 方法 的 重要 性 。 但 是 ,尽管 使 用 概率 模型 的 兴趣 日 益 
增加 ,物理 学 家 依旧 用 确定 性 模型 来 模拟 量子 和 其 他 现象 ,并 且 , 他 们 继续 使 用 
微分 方程 方法 ,不 管 是 概率 性 的 还 是 确定 性 的 。 物 理学 家 被 引 向 使 用 更 多 统计 
模型 的 原因 之 一 是 ,他 们 想 在 微分 方程 模型 中 纳入 更 多 的 统计 测量 ,并 不 局 限 
于 使 用 微分 方程 。 因 此 ,在 很 大 程度 上 , 当 社 会 科学 家 越 来 越 多 地 使 用 微分 方 
程 ,而 自然 科学 家 和 物理 学 家 越 来 越 多 地 应 用 概率 统计 模型 时 ,在 所 有 科学 ( 包 
括 社会 科学 ) 中 常用 的 数学 方法 越 来 越 相似 。 


确定 性 微分 方程 和 概率 性 微分 方程 的 比较 


为 什么 社会 科学 家 应 该 使 用 确定 性 数学 ? 这 个 问题 在 社会 科学 领域 内 一 
直 存 在 争议 (Coleman, 1964:526 一 528)。 坦 白地 讲 , 大 部 分 争论 的 赢家 似乎 都 
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是 概率 数学 的 提倡 者 ,通常 他 们 无 论 是 从 数量 上 (概率 数学 的 支持 者 居多 ) 还 是 
从 争辩 中 (假定 社会 现象 存在 随机 性 的 固有 本 质 ) ,都 胜 过 确定 性 论 者 。 乍 看 之 
下 ,形势 是 倾向 于 概率 论 者 这 边 ,但 实际 上 ,这 场 争论 并 没有 定论 。 这 场 争 论 的 
真正 答案 归结 于 细 化 的 程度 。 记 住 , 所 有 的 数学 模型 (包括 确定 性 的 和 概率 性 
的 ) 都 是 对 事物 的 复杂 过 程 的 近似 处 理 。 任 何 模型 构建 的 一 个 本 质 特 征 是 通过 
忽略 许多 其 他 因素 来 获得 简约 性 ,从 而 分 析 最 重要 的 因素 。 底 线 则 变 成 每 个 模 
型 接近 复杂 过 程 的 程度 ,以 臻 最 终 的 数学 模型 大 部 分 近似 表现 了 真实 世界 的 发 
展 过 程 。 我 的 基本 观点 (在 后 面 将 进一步 解释 ) 是 ,确定 性 数学 比 概率 数学 的 代 
数 形式 更 丰富 , 它 能 弥补 概率 数学 中 的 信息 丢失 ,这 种 丢失 是 在 随机 模型 的 建 
立 过 程 中 ,因为 忽略 某 些 更 复杂 的 概率 信息 而 造成 的 。 

确定 性 模型 比 大 部 分 随机 模型 更 细 化 ,能 更 好 地 模拟 细微 之 处 。 随 机 模型 
也 是 方程 ,但 在 大 部 分 情形 中 ,能 有 效 使 用 的 随机 模型 必须 能 够 有 效 地 处 理 统 
计 变 异 ,这 是 因为 ,随机 模型 是 建立 在 概率 分 布 的 基础 上 的 。 把 概率 分 布 直接 
纳入 一 个 模型 中 大 大 增加 了 模型 的 复杂 性 ,即使 对 模型 稍 作 细 化 也 会 使 得 模型 
无 法 处 理 。 也 就 是 说 ,随机 模型 只 有 当 参 数 的 解法 能 被 编 进 标准 的 统计 软件 时 
才 可 用 。 这 样 的 软件 一 般 是 用 来 求 变 量 之 间 的 相关 关系 ,然后 识别 因 变量 的 各 
个 影响 因素 。 模 型 本 身 一 般 是 “ 即 插 即 用 ”的 ,从 某 种 意义 上 来 说 ,研究 人 员 可 
以 把 自己 的 变量 放 入 之 前 定义 好 的 代数 式 中 。 但 当 我 们 使 用 确定 性 模型 时 ,我 
们 能 进入 一 个 变化 的 代数 领域 ,这 是 随机 模型 运用 者 难以 想象 的 。 这 种 做 法 常 
常 需要 研究 者 舍弃 简单 模型 中 常用 的 “ 即 插 即 用 ”估计 程序 。 

这 场 争论 也 存在 男 一 方面 的 问题 。 当 随机 模型 理论 上 限于 至 少 一 个 随机 
变量 时 ,它们 就 无 法 构建 于 一 个 内 在 的 确定 性 “核心 ”中 ,也 就 是 说 ,一 个 确定 性 
部 分 加 上 一 个 随机 部 分 。 由 此 可 以 看 出 ,把 模型 区 分 为 “确定 性 模型 "和 “统计 
模型 "的 主要 依据 是 ,确定 性 模型 常常 比 统计 模型 的 核心 部 分 更 微妙 。 例 如 , 直 
线 方程 是 确定 性 的 , 且 直 线 方程 是 大 部 分 统计 模型 的 基础 。 线 性 方程 的 简化 形 
式 使 得 统计 学 家 们 能 明确 地 解 出 方程 的 参数 (如 斜率 和 截 距 ) 。 统 计 学 家 也 能 
将 统计 假设 应 用 到 模型 中 。 参 数 有 明确 的 解 , 且 通过 将 概率 分 布 融 人 到 模型 中 
而 成 功 地 把 模型 中 的 确定 性 核心 部 分 变 成 一 个 统计 模型 。 但 是 ,要 做 到 这 些 ， 


微分 方程 :一 种 建 模 方法 | 


研究 人 员 必 须 既 要 找到 一 个 能 得 出 明确 的 参数 解 的 模型 ,也 要 能 找到 与 这 个 模 
型 的 不 同 部 分 有 关 的 概率 分 布 。 研 究 人 员 没 必要 生成 一 个 不 能 用 概率 数学 解 
答 其 参数 的 复杂 模型 。 

使 用 确定 性 模型 的 真正 原因 在 于 希望 发 现 更 有 趣 的 建 模 方法 ,以 便 正 确 解 
释 社 会 现象 ,而 至 今 并 没有 现成 的 统计 方法 能 够 解决 这 个 问题 。 特 定 的 概率 假 
设 可 能 不 适用 这 些 模型 ,而 与 这 些 模 型 相关 的 概率 分 布 及 其 参数 也 可 能 未 知 。 
但 是 ,这 些 模 型 中 的 代数 部 分 却 是 它们 的 价值 所 在 。 确 定性 模型 中 的 代数 能 根 
据 研究 的 社会 现象 的 本 质 需要 来 细 化 。 实 际 上 ,任何 一 个 统计 学 家 都 会 告 i 
你 ,每 一 个 建 模 的 人 可 能 犯 的 最 大 错误 是 ,一 开始 就 找 错 了 模型 。 一 个 错误 的 
模型 的 参数 估计 通常 是 毫 无 价值 的 。 因 此 ,如 果 研 究 人 员 想 要 模拟 能 很 好 地 解 
释 存在 细微 差异 的 社会 现象 的 理论 ,就 最 好 使 用 确定 性 模型 ,因为 确定 性 模型 
比 统计 模型 能 更 好 地 抓 住 这 些 细微 之 处 ,而 统计 模型 为 了 能 利用 现成 的 估计 方 
法 ,一 般 会 忽略 这 些 细微 差异 。 

我 们 把 微分 方程 视 为 确定 性 的 是 由 于 这 些 模 型 的 最 基本 成 分 中 存在 确切 
的 统计 对 应 部 分 。 幸 运 的 是 ,最 近 几 年 ,确定 性 数学 发 展 迅速 ,现在 几乎 可 以 完 
全 估计 所 有 的 确定 性 模型 。 因 此 ,确定 性 模型 和 统计 模型 在 实践 方面 的 差距 正 
在 缩小 ,将 来 会 有 那么 一 天 , 即 当 研究 人 员 建 模 时 ,仅仅 把 模型 称 为 “模型 ”, 而 
不 再 具体 区 分 是 确定 性 模型 还 是 统计 模型 。 

微分 方程 既 适 用 于 确定 性 变异 ,也 适用 于 概率 性 变异 。 本 书 主要 介绍 确定 
性 微分 方程 。 概 率 性 微分 方程 在 两 方面 和 确定 性 微分 方程 存在 本 质 差 异 。 首 
先 ,概率 微分 方程 用 来 模拟 一 个 事件 发 生 的 概率 ,因此 ,概率 模型 描述 了 所 有 事 
件 。 但 是 ,确定 性 模型 则 能 直接 模拟 这 个 事件 本 身 ( 不 是 这 个 事件 发 生 的 概 
率 ) ,也 可 能 预测 一 个 事件 发 生 的 片断 。 除 非 事 件数 量 或 总 体 规模 非常 小 ,否则 
这 两 个 模型 在 这 点 上 不 存在 很 大 差异 (Mesterton-Gibbons，1989) 。 其 次 ,概率 
微分 方程 比 确定 性 微分 方程 提供 了 更 丰富 的 描述 。 两 种 微分 方程 都 提供 平均 
的 预测 值 ,但 只 有 概率 模型 在 给 出 这 些 平 均 预 测 值 的 同时 ,也 提供 计算 方差 的 
公式 。 但 也 存在 一 个 问题 , 即 概率 微分 方程 将 给 数学 计算 带 来 巨大 的 难度 
(Brown, 1995b:% 1 章 ), 即 便 是 用 最 简单 的 模型 ,也 会 出 现 这 样 的 情况 。 从 数 
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学 方法 的 角度 来 看 ,概率 模型 的 更 复杂 的 细 化 很 快 变 得 难以 解答 。 有 必要 强调 
的 是 ,与 概率 模型 相 比 ,确定 性 模型 唯一 的 缺点 在 于 不 能 计算 平均 预测 值 的 方 
差 。 此 外 ,如 果 有 能 力 估计 参数 值 及 其 统计 显著 性 ,确定 性 模型 还 是 能 够 采用 
很 多 统计 测量 方法 的 。 最 后 ,用 确定 性 微分 方程 建 模 能 让 我 们 从 数学 方面 进行 
更 多 复杂 有 趣 的 细 化 ,而 这 是 难以 用 概率 方法 做 到 的 。 因 此 ,在 使 用 确定 性 模 
型 时 ,我 们 以 失去 一 小 部 分 概率 分 析 来 赢得 巨大 的 细 化 模型 的 灵活 性 。 


什么 是 微分 方程 ? 


在 基础 数学 中 ,方程 一 般 写成 一 个 因 变量 作为 一 个 或 多 个 自 变量 的 函数 。 
例如 ,方程 y = mz +b 是 一 个 直线 方程 ,其 中 ,y 是 因 变 量 ,x 是 自 变量 ,m 是 直 
线 的 斜率 ,2 是 直线 的 截 距 。 不 过 ,微分 方程 是 方程 中 存在 导数 的 函数 ,如 方程 
1. 1 所 示 : 

dy/dt = ay [1.1] 


在 这 个 方程 中 ,y 是 因 变量 ,x( 时 间 ) 是 自 变 量 ,a 是 参数 。 在 这 种 情况 下 ,给 出 的 
方程 没有 定义 y 值 ,而 是 定义 y 的 变化 量 。 因 此 ,方程 1. 1 表达 的 是 ,y 的 变化 
率 依赖 于 y 值 本 身 。 当 y 值 增加 时 , 它 的 变化 率 也 增加 (只 要 参数 a EERO. 
这 类 方程 称 为 “ 常 微分 方程 ”, 因为 它 仅 仅 包括 普通 的 导数 ,而 不 包括 偏 导数 。 
包括 偏 导数 的 方程 称 为 " 偏 微分 方程 ”。 偏 导数 如 ay/az 式 所 示 。 在 本 书 中 ,我 
们 只 介绍 常 微分 方程 。 在 一 些 书 中 , 常 微分 方程 有 时 缩写 成 "<ODE”。 为 了 解释 
的 方便 ,本 书 中 提 到 的 微分 方程 都 指 常 微分 方程 。 

值得 注意 的 是 ,方程 1. 1 中 的 自 变 量 并 没有 出 现在 方程 的 右边 。 这 类 微分 
方程 称 为 "自主 的 ”。 如 果 自 变量 : 作为 一 个 自 变量 出 现 , 则 称 这 个 方程 为 “ 非 自 
EM)”. 方程 1.2 是 方程 1. 1 的 非 自主 形式 : 


dy/dt = ay + cos(t) [12] 


常 微 分 方程 1. 1 也 称 为 "一 阶 微分 方程 >。 在 一 阶 方程 中 ,导数 出 现 的 最 高 阶 数 
是 一 阶 。 在 这 个 例子 中 ,最 高 阶 导 数 是 dy/dt。 方程 1.3 是 二 阶 微分 方程 ,因为 
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方程 的 最 高 阶 导数 是 d? y/dr 。 在 这 类 方程 中 ,一 阶 导数 可 有 可 无 : 
d’y/dt” = ay [1.3] 


PSY Ta FE BT AAR OR Kt. AES E P ST Te FRC» J BT RH 
小 称 为 "次数 ”。 微 分 方程 的 次 数 指 方程 中 最 高 阶 导 数 的 次 数 。 因 此 ,方程 1. 4 
是 一 个 二 次 一 阶 微分 方程 : 

(dy/dt)’ = ay [1. 4] 


方程 1. 4 中 的 表达 法 有 点 麻烦 。 因 此 ,有 些 作者 会 用 y 来 表示 一 阶 导 数 ， 
y 来 表示 二 阶 导 数 ,等 等 。 因 此 ,方程 1.4 可 以 简化 为 : 


y? = ay [1.5] 


还 有 另 一 种 方式 可 表示 导数 。 此 时 ,我 们 用 点 来 表示 导数 的 阶 数 ,尤其 是 当时 
间 上 为 自 变量 时 。 例 如 ,方程 1. 1 可 以 写成 : 

y=ay 
为 了 统一 表达 方式 ,本 文 均 采用 方程 1. 1 和 方程 1. 5 中 的 表达 方式 。 

如 果 方 程 中 除 参 数 之 外 的 变量 之 间 仅 仅 是 加 法 关系 , 则 称 这 种 微分 方程 为 
“线性 微分 方程 >。 其 他 的 均 为 非 线 性 微分 方程 。 因 此 ,一 个 线性 微分 方程 中 不 
包括 自 变 量 或 因 变 量 的 寡 次 或 乘积 项 。 因 此 ,方程 1. 1 和 方程 1. 3 是 一 次 线性 
自主 微分 方程 ,而 方程 1. 6 是 一 次 非 线 性 自主 的 一 阶 微分 方程 。 更 确切 地 说 , 方 
程 1. 1 和 方程 1. 3 的 因 变 量 y 是 线性 的 ,而 方程 1.6 中 的 y 是 非 线 性 的 : 


dy/dt = ay? [1.6] 


本 书 主要 介绍 一 次 线性 或 非 线性 的 一 阶 和 二 阶 微分 方程 。 微 分 方程 常用 于 研 
究 两 个 或 多 个 一 阶 常 微 分 方程 组 。 实 际 上 ,任何 二 阶 微分 方程 都 能 表示 为 一 阶 
常 微分 方程 组 ,这 会 在 后 面 的 章节 中 加 以 介绍 。 而 且 , 一 个 非 自主 微分 方程 也 
可 以 写成 一 阶 微分 方程 组 (这 也 将 在 后 面 的 章节 介绍 )。 因 此 ,理解 如 何 使 用 一 
阶 微分 方程 (或 方程 组 ) 是 处 理 包 括 微 分 方程 在 内 的 许多 不 同情 形 的 关键 ,这 也 
是 本 书 重点 介绍 一 阶 微分 方程 的 原因 。 
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研究 微分 方程 的 基础 是 解 方程 。 按 照 惯 例 ,求解 微分 方程 即 找到 一 个 函数 
能 明确 解 出 因 变 量 的 值 ,而 不 是 因 变 量 的 变化 值 。 有 很 多 方法 可 以 用 来 求解 不 
同 种 类 的 微分 方程 。 了 解 这 些 方 程 是 如 何 求解 的 意义 在 于 ,这 可 以 帮助 我 们 更 
好 地 理解 微分 方程 的 一 般 特征 。 例 如 ,方程 1. 1 是 一 个 随时 间 变 化 的 指数 增长 
模型 , 即 托 马 斯 . 马尔萨斯 (Thomas Malthus) 关 注 人 口 数 量 时 描述 的 一 个 动态 
过 程 。 为 什么 这 个 “指数 增长 ”模型 从 微分 方程 的 数学 表达 式 角度 来 看 不 是 很 
直接 清晰 ? 不 过 , 当 我 们 在 下 一 章 求解 这 个 问题 的 时 候 , 就 会 变 得 一 目 了 然 。 

本 书 以 一 阶 微分 方程 为 例 ,介绍 用 分 离 变 量 法 来 求解 一 些微 分 方程 的 方 
法 。 传 统 的 微分 方程 教科 书 一 般 都 会 用 大 量 篇 幅 讲解 如 何 利用 各 种 求解 方法 
来 找到 不 同 微分 方程 类 型 的 确切 解 ,但 这 种 方法 越 来 越 不 受 关注 。 目 前 许多 
(有 人 会 说 大 部 分 ) 有 趣 的 介绍 微分 方程 的 书 并 不 是 去 收集 最 后 得 到 确切 解 的 
方法 。 过 去 ,为 了 理解 事物 的 特性 ,我 们 需要 得 到 微分 方程 的 确切 解 ,但 现在 关 
于 微分 方程 的 研究 集中 在 通常 找 不 到 确切 解 的 微分 方程 的 特性 。 这 主要 归功 
于 现代 计算 机 技术 的 发 展 。 计 算 机 通过 不 需要 明确 求解 方程 的 数值 技术 来 解 
微分 方程 。 本 书 以 同样 的 方式 根据 微分 方程 的 特性 来 讲解 。 而 且 , 除 了 两 个 例 
外 之 处 ,本 书 的 其 他 部 分 都 采用 数值 方法 来 求解 。 第 一 处 例外 是 讲解 分 离 变 量 
法 , 另 一 处 是 介绍 一 阶 线性 方程 组 的 求解 。 这 些 例外 仅仅 起 启发 作用 ,并 不 会 
减弱 数值 方法 的 重要 性 。 因 为 现在 微分 方程 的 数值 求解 法 非常 重要 ,所 以 值得 
花 更 多 些 时间 来 解释 它们 的 使 用 原理 。 

当 使 用 微分 方程 来 模拟 社会 现象 时 ,我们 不 再 局 限于 直接 能 解答 的 线性 微 
分 方程 。 方 程 1. 1 是 微分 方程 最 简单 的 形式 ,很 容易 就 能 求解 。 但 是 在 一 般 情 
况 下 ,大 部 分 微分 方程 问题 都 可 能 无 解 ,尤其 是 非 线 性 微分 方程 。 非 常 幸运 的 
是 ,现在 用 计算 机 很 容易 就 能 解 出 微分 方程 的 因 变量 。 这 样 的 数值 方法 几乎 能 
用 于 所 有 的 微分 方程 。 使 用 这 些 数 值 方法 时 ,仅仅 需要 原始 的 微分 方程 和 初始 
条 件 。 

这 些 数值 方法 的 种 类 繁多 ,并 呈 稳 定 增长 的 趋势 ,每 种 方法 在 计算 速度 和 / 
或 数值 灵敏 性 方面 存在 自身 独特 的 优势 。 本 书 介绍 了 其 中 3 种 最 重要 的 方法 。 
实际 上 ,前 两 种 (Euler 方 法 和 Heun 方法 ) 在 这 里 主要 用 来 帮助 启发 我 们 理解 四 
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次 Runge-Kutta 方法 。Runge-Kutta 方法 在 大 部 分 情况 下 是 首选 。 在 下 面 的 章 
节 中 ,我 们 将 更 深入 地 介绍 这 些 方法 。 


本 书 的 内 容 


对 大 部 分 学 科 来 说 ,学 生 选 修 完 成 一 门 大 学 课程 之 后 ,即便 是 在 刚刚 修 完 
的 时 候 ,往往 也 只 能 记 住 课程 内 容 的 一 部 分 。 本 书 旨 在 让 读者 记 住 书 中 的 知 
识 , 令 选修 微分 方程 课程 的 学 生 学 会 应 用 ,并 在 他 们 以 后 的 科研 中 派 上 用 场 。 
因此 ,希望 读者 能 在 以 后 的 科学 研究 中 记 住 本 书 所 介绍 的 核心 知识 。 也 就 是 
说 ,一 门 微分 方程 的 课程 及 其 使 用 的 教材 可 能 涵盖 了 比 本 书 更 多 的 信息 量 。 

下 面 举 个 例子 来 说 明 。 大 部 分 微分 方程 的 课程 都 集中 讲述 方程 解 的 存在 
唯一 性 定理 。 也 就 是 说 , 当 研 究 一 个 微分 方程 时 ,数学 家 们 想 弄 清楚 ,方程 是 否 
确实 有 解 ,这 个 解 是 不 是 给 定 的 自 变 量 值 的 唯一 解 。 这 点 对 理论 比 对 微分 方程 
的 应 用 更 重要 ,因为 对 于 大 部 分 合理 的 微分 方程 模型 来 说 ,证 明 其 存在 和 唯一 
性 并 不 是 特别 困难 。 实 际 上 ,我们 很 少 能 在 发 表 的 文章 中 看 到 花 篇 幅 去 证 明 模 
型 解 的 唯一 存在 性 。 如 果 本 书 要 讨论 模型 解 的 存在 唯一 性 ,我 就 需要 删 减 对 应 
用 微分 方程 建 模 进行 评价 的 大 量 其 他 信息 。 实 际 上 ,出 于 同样 的 原因 ,也 有 很 
多 书 为 了 集中 讨论 模型 的 应 用 而 不 讨论 解 的 唯一 存在 性 。 虽 然 这 个 问题 非常 
重要 ,但 作者 们 假设 学 习 微分 方程 的 学 生 已 经 具备 了 相关 的 知识 。 

本 书 集中 讨论 利用 数值 方法 解决 微分 方程 组 ,这 是 最 近 学 术 圈 的 研究 趋 
势 。 很 多 书 虽 然 也 涵盖 了 数值 方法 ,但 微分 方程 的 传统 求解 方法 主要 是 找到 其 
分 析 解 。 侧 重 数值 方法 和 求 分 析 解 都 各 有 吸引 人 的 地 方 。 但 在 一 般 情况 下 , 除 
了 最 简单 的 非 线 性 模型 外 ,一 般 很 难 或 几乎 不 可 能 求 得 分 析 解 ,而 数值 方法 既 
能 处 理 线性 问题 ,也 能 处 理 非 线性 问题 。 因 此 ,本 书 只 简单 介绍 一 些微 分 方程 
的 分 析 解 的 求法 。 

本 书 还 会 介绍 求解 一 阶 微分 方程 的 分 离 变 量 法 以 及 存在 两 个 不 同 实 根 的 
二 阶 线性 微分 方程 的 求解 。 其 他 类 型 的 二 阶 微分 方程 的 求解 也 有 介绍 ,但 并 不 
是 推导 得 出 的 。 许 多 数学 家 可 能 认为 需要 把 这 部 分 补充 进来 ,否则 就 不 完整 。 
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然而 ,对 线性 微分 方程 其 他 类 型 解 的 推导 在 其 他 参考 书 中 会 有 论述 ,本 书 并 不 
是 一 本 包括 微分 方程 各 方面 的 教科 书 , 因 此 ,学 生 如 果 想 更 深入 地 学 习 , 可 参考 
其 他 相关 教科 书 。 而 且 ,一 些 数 学 家 也 认为 ,事实 上 ,分 析 解 在 线性 微分 方程 模 
型 之 外 ,一 般 很 少 用 于 处 理 其 他 问题 ,因此 ,加 强 适用 范围 更 广 的 数值 方法 在 建 
模 过 程 的 应 用 ,将 会 有 很 多 启发 性 优势 (Kocak，1989)。 实 际 上 , 布 兰 查 德 
(Blanchard) , 德 瓦 尼 (Devaney) 和 霍 尔 (Hall) 也 提 到 ,“ 鉴 于 如 今 科技 的 发 展 ,过 
分 强调 解决 微分 方程 的 具体 技巧 的 传统 观点 已 经 不 再 适用 了 ”,“ 很 多 最 重要 的 
微分 方程 是 非 线 性 的 ,在 这 种 情况 下 ,数值 和 定性 方法 比分 析 技 术 效 率 更 高 ” 
(2006: vii). 

本 书 也 没有 介绍 有 关 经 验 数 据 的 检验 问题 。 与 线性 方程 模型 估计 相 比 , 微 
分 方程 模型 的 参数 估计 的 挑战 性 大 得 多 。 这 点 不 仅 表现 在 处 理 连续 时 间 变 量 
的 问题 上 ,还 表现 为 常常 伴随 微分 方程 模型 出 现 的 复杂 的 非 线性 数学 。 参 数 估 
计 方 法 经 常 使 用 工程 学 中 常用 的 计算 机 化 数值 技术 。 鉴 于 计算 机 的 高 速 运算 
能 力 , 这 些 模型 的 估计 方法 是 完全 可 行 的 , 且 经 常 能 见 到 。 完 全 估计 连续 时 间 
微分 方程 组 及 其 方法 的 介绍 实例 可 参见 布朗 (1995a) ,更 多 使 用 数值 方法 来 评估 
模型 的 方法 可 以 参见 汉 明 (Hamming, 1971, 1973), 

尽管 本 书 有 很 多 局 限 性 ,但 本 书 不 仅仅 是 一 本 微分 方程 的 入 门 书 ,还 包括 
了 一 些 把 微分 方程 用 于 社会 科学 研究 中 不 可 或 缺 且 非常 有 价值 的 材料 。 大 体 
上 ,本 书 涵盖 了 所 有 (或 至 少 大 部 分 ) 把 微分 方程 应 用 到 社会 科学 中 所 必需 的 知 
识 。 因 此 ,虽然 本 书 不 是 一 本 涵盖 微分 方程 各 个 方面 的 书 ,但 是 它 介绍 了 很 多 
人 处理 微分 方程 模型 的 方法 ,这 足以 满足 建 模 的 需要 。 研 究 人 员 也 可 以 通过 阅读 
其 他 书籍 来 拓展 这 方面 的 知识 。 


ken OO ti 


微分 方程 的 研究 起 源 于 怎么 求解 这 些 方 程 。 为 什么 我 们 需要 求解 微分 方 
程 ,而 不 使 其 保持 原样 呢 ? 由 于 这 本 书 处 理 微 分 方程 在 时 间 方 面 的 应 用 , 则 微 
分 方程 的 解 必 然 是 时 间 的 函数 。 例 如 ,微分 方程 zy/dz 的 解 是 函数 f (1) ,这 意 
味 着 ,我 们 可 以 把 因 变量 y 替换 成 f(t)。 我 们 对 这 个 微分 方程 的 解 感 兴趣 是 因 
为 我 们 想得到 一 个 能 给 出 任 一 时 点 的 > 值 的 函数 。 作 为 科学 家 ,我 们 不 仅仅 要 
研究 因 变量 y 的 变化 ,也 要 研究 y 的 值 。 因 此 ,如 果 我 们 不 研究 > 本 身 , 我 们 也 
需要 找到 别 的 方法 得 到 这 个 变量 值 。 

有 两 种 方法 可 以 解 微分 方程 :第 一 种 是 使 用 不 定 积分 法 的 分 析 解 ,第 二 种 
是 使 用 操作 性 更 强 的 定 积分 法 来 解决 问题 的 计算 数值 方法 。 我 们 从 探求 微分 
方程 的 分 析 解 着 手 , 介 绍 微分 方程 的 求解 问题 。 


线性 一 阶 微分 方程 组 的 分 析 解 


下 面 , 我 们 从 例子 开始 ,如 下 面 的 微分 方程 : 
dy/dt =— 3y 
或 
dy/dt +3y =0 [2.1] 
方程 2. 1 是 微分 方程 的 一 般 形式 ,> Aly 的 导数 都 在 方程 的 同 侧 。 方 程 2. 1 的 
一 个 解 为 f(z) = 4e. 为 了 说 明 这 是 方程 的 一 个 解 ,我 们 需要 知道 f(z) = 
dy/dt。 注意 , f (1) = (4e3) =— 12e, 现在 用 了 (1) 替换 方程 2. 1 中 的 


176 


| 社会 科学 中 的 数理 基础 及 应 用 


dy/dt, FA 4e “替换 >y, 得 到 : 
一 12e3 + 3(4e*) =— 12e* 4+ 12e% = 0 


从 这 里 可 以 看 出 ,方程 2. 1 的 一 个 解 为 y = 4e™。 

有 趣 的 是 , y = 4e* 并 非 方程 2. 1 的 唯一 解 。 读 者 可 以 看 出 , y = 5e”, 
y= be”, y= Te", 其 至 yy 二 1298e“ 都 是 方程 2.1 的 解 。 如 果 把 这 些 解 代入 
方程 ,方程 2. 1 都 成 立 。 如 果 我 们 想 找 出 方程 2. 1 的 特定 解 , 则 需要 一 个 附加 条 
件 。 我 们 需要 知道 因 变量 y 的 起 始 条 件 ( 或 初 值 )。 一 旦 给 定 微分 方程 及 其 初 
[ECCE t = 0 时 的 值 ) ,确定 微分 方程 的 唯一 解 的 问题 就 称 为 “ 初 值 问题 ”。 

值得 注意 的 是 ,微分 方程 的 解 与 一 般 算 术 方 程 的 解 存在 两 个 关键 的 不 同 。 
首先 ,算术 方程 的 解 是 数字 ,而 微分 方程 的 解 是 方程 。 例 如 ,算术 方程 3+ 一 6 = 
0 的 解 是 2, 是 个 数字 。 其 次 ,微分 方程 可 能 存在 无 数 个 解 ,其 特定 解 依赖 于 微分 
方程 的 初 值 。 


分 离 变量 法 求解 一 阶 微分 方程 


如 果 一 个 微分 方程 是 “分 离 的 ”, 则 求解 这 个 方程 的 分 析 解 的 方法 称 为 “分 
离 变量 法 ”。 当 一 个 微分 方程 可 以 表示 为 两 个 方程 的 积 (或 商 ) ,每 个 仅 依 赖 于 
一 个 变量 , 则 称 这 个 微分 方程 是 "可 分 离 的 "~。 例 如 ,方程 2.2 是 可 分 离 的 ,因为 
gM AEE i, 而 h(y) 仅 依赖 于 因 变量 y。 之 后 我 们 会 看 到 ,即使 方程 
中 没有 出 现 g() 或 (y) ,也 没 问题 。 


dy/dt = g(t)/h(y) [2.2] 


要 求 方程 2. 2 的 解 ,可 以 先 把 方程 2. 2 变换 成 h(y)dy = god, 然后 对 两 边 积 
分 ,得 到 方程 2. 3: 


Jacway = fewa [2.3] 


刚 开始 我 们 可 能 难以 理解 ,为 什么 仅仅 通过 变换 方程 2. 2 就 能 对 方程 2. 3 积 
Tt (REP GA H AEM g 和 的 不 定 积分 ,也 就 是 说 ,g EONS 
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Bh te H WFR Fl) A Go BY a UIA N , RATE LAGE Cy) — GO) 对 1 的 导 
数 写成 : 

H'(y)dy/dt —G'(t) = h(y)dy/dt — g(t) 
但 是 ,从 方程 2. 2 的 变换 中 得 到 h(y)dy/dt — g(t) = 0, 这 意味 着 HO) — GU) 
对 1 的 导数 也 为 0。 然 而 ,只 有 常数 的 导数 才 等 于 0。 这 就 意味 着 , Hy) — GU) 
等 于 一 个 常数 ,我 们 用 C 来 表示 。 由 于 有 (y) 一 G(z) =C, 我 们 可 以 把 它 变换 为 
Hy) = GQ) +C. 这 个 方程 等 同 于 下 面 的 方程 : 


[acway = feod FE 


以 上 步 又 证 明了 为 什么 可 以 用 分 离 变量 法 来 求解 微分 方程 。 

分 离 变量 法 最 好 通过 实例 来 介绍 ,下 面 通过 介绍 4 种 常见 微分 方程 的 求解 
来 举例 说 明 。 这 4 种 微分 方程 是 许多 常用 的 高 级 微分 方程 的 基本 组 成 部 分 , 建 
议 读者 深入 研究 它们 。 实 际 上 ,人 詹姆斯" 科 尔 曼 (1964:41 一 46) 称 这 几 个 经 典 的 
微分 方程 形式 为 广泛 应 用 在 扩散 模型 中 的 “理想 类 型 ”。 


指数 增长 型 


这 4 种 微分 方程 中 的 第 一 种 其 实在 前 面 的 例子 中 出 现 过 , 即 指数 增长 型 , 形 
如 dy/dt =ay, 如 第 1 章 的 方程 1. 1。 在 这 个 自主 方程 式 中 ,变量 1 没有 出 现在 
方程 的 右 侧 。 方 程 2.2 也 可 称 为 指数 增长 型 ,因为 x* = 1, 因此 ,在 方程 2.2 中 ， 
ga) =l, 

方程 1. 1 有 明确 的 解 ,可 以 使 用 传统 的 积分 方法 来 求 , 如 下 所 示 。 通 过 把 方 
程 1.1 的 变量 分 离 , 得 到 ; 

(1/y)dy = adt 

这 就 是 一 个 简单 的 积分 问题 : 


|a/way = faar 


得 到 这 个 问题 的 最 终 解 的 中 间 步 又 是 : 
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In| y |= at +C 


其 中 ,C 是 积分 得 到 的 常数 。 


edly = eat = ee. 


t= 0, 我们 可 以 得 到 yo SEL, » 是 因 变量 的 初始 条 件 。 因 此 ,方程 1.1 的 
解 可 以 表示 成 方程 2. 4。 这 个 解 称 为 这 个 微分 方程 的 “ 通 解 ”: 


y= yoe” [2.4] 


一 般 情 况 下 , 当 我 们 给 出 一 个 因 变 量 的 微分 方程 时 ,也 会 给 出 它 的 初始 条 件 。 
如 前 所 述 , 因 变量 的 微分 方程 和 其 初 值 一 并 称 为 “ 初 值 问题 ”。 一 旦 得 到 如 方程 
2.4 这 样 的 解 和 y 的 初 值 , 则 可 以 得 到 这 个 微分 方程 的 “特定 解 >。 这 个 特定 解 
将 给 出 一 个 方程 ,能 得 到 因 变 量 在 任何 时 点 的 值 。 
如 微分 方程 dy/dt = 3y, H t = 0 if, y 的 值 为 0.1。 由 于 我 们 给 出 了 一 
个 微分 方程 及 其 初始 条 件 , 因 此 这 是 个 初 值 问题 。 首 先 需 要 得 到 微分 方程 的 通 
解 , 即 ， 
y = yoe” [2. 5] 


由 于 当 t 二 0 时 , y= 0.1, 所 以 我 们 可 以 把 这 些 值 代 入 方程 2. 5 获得 中 间 步 又 
0.1 一 ye， 即 0.1 一 %。 因 此 ,微分 方程 的 特定 解 是 > = 0. le”, 从 这 个 特定 解 
可 以 很 容易 看 出 方程 1. 1 给 出 的 微分 方程 用 于 模拟 指数 增长 的 原因 , 即 当 时 间 
从 0 增加 到 无 限 大 时 ,y 值 成 指数 增加 ,如 图 2. 1(a = 3) 所 示 。 这 类 图 称 为 一 个 
“时 间 序 列 ”, 因 为 因 变 量 的 值 和 时 间 分 别 呈 现在 y 轴 和 zz 轴 。 一 般 把 时 间 设 为 
工 轴 , 但 这 并 不 是 硬性 要 求 。 如 时 间 序 列 图 中 所 示 , 因 变量 的 值 可 以 通过 把 自 变 
E t 的 值 代入 微分 方程 的 特定 解 得 到 。 

从 图 2. 1 可 以 看 出 ,变量 y 的 增长 率 (dy/dt) 随 时 间 的 增加 而 增长 (变量 y 
的 值 也 增长 ) ,这 就 意味 着 ,y 的 二 阶 导数 是 正 的 。 如 果 没 有 受到 干预 ,这 个 微分 
方程 存在 潜在 的 爆炸 特性 ,这 也 是 托马斯 ， 马尔萨斯 对 人 口 增长 如 此 关注 的 原 
因 。 增 长 率 与 因 变 量 大 小 成 比例 的 情形 称 为 经 历 “ 正 反馈 ”(Crosby，1987)， 
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因 变 量 
> 


0.2 
0.0 
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 
时 间 
图 2.1 指数 增长 
这 是 因为 因 变 量 的 增加 反馈 到 系统 里 ,从 而 引起 这 个 变量 附加 的 增长 ,导致 之 
前 的 增长 率 增加 。 


指数 衰减 


指数 衰减 和 指数 增长 相 类 似 , 仅 有 的 区 别 在 于 ,方程 1. 1 中 的 参数 a 是 负 
值 。 这 类 动态 过 程 非常 适宜 模拟 物质 的 衰变 率 与 其 质量 成 比例 的 现象 。 这 种 
动态 过 程 的 经 典 例子 之 一 是 放射 性 物质 的 半衰期 ,而 许多 社会 现象 也 呈现 出 这 
种 衰减 特性 。 实 际 上 ,研究 社会 系统 的 理论 家 们 (Brown,，2008; Cortés el al. , 
1974) 都 知道 ,“ 社 会 记忆 ”的 概念 与 半衰期 很 相似 。 一 般 情 况 下 ,任何 系统 本 质 
上 都 是 动态 变化 的 ,它们 根据 不 同 的 投入 得 到 不 同 的 产 出 。 当 对 一 个 系统 投入 
时 ,我 们 自然 会 问 , 这 个 投入 对 系统 的 影响 会 持续 多 久 , 从 而 想得到 这 个 系统 的 
半衰期 。 一 般 而 言 ,大 部 分 发 生 的 事件 对 相关 的 社会 系统 的 影响 最 终 都 会 消 
失 。 例 如 ,突然 爆发 的 暴乱 都 会 慢 慢 消失 ,丑闻 开始 会 引起 广大 媒体 的 关注 ,但 
最 终 也 会 从 公众 的 意识 中 慢 慢 消去 ,许多 疾病 (如 流感 ) 能 感染 很 多 群体 ,但 也 
最 终 会 消逝 。 更 具体 的 例子 如 , 普 齐 沃 斯 奇 (1975) 关 于 人 们 对 选举 不 稳定 的 系 


社会 科学 中 的 数理 基础 及 应 用 
180 | 


统 记忆 、 布 衣 (1997: 第 7 章 ) 对 国会 流动 圈 的 系统 记忆 研究 。 注 意 到 系统 记忆 同 
时 适用 于 微分 方程 和 差分 方程 是 非常 有 用 的 。 

指数 衰减 的 时 间 序 列 图 如 图 2. 2 所 示 。 在 这 个 图 中 ,方程 1. 1 中 的 参数 a 
的 值 为 一 3。 这 个 图 的 初 值 为 mw = 1. 8, 其 半衰期 是 初 值 的 一 半 消 失 时 的 时 间 ， 
即 当 y = 0.9 时 的 时 间 。 


因 变 量 
© 


0.2 


0.0 
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 


时 间 
图 2.2 指数 衰减 


学 习 曲 线 和 非 交 互 性 扩散 


当 执 行 一 项 新 任务 的 时 候 , 一 般 开 始 的 时 候 , 工 作 效 率 可 能 比较 低 。 例 如 ， 
可 能 会 遇 到 需要 别人 指导 的 无 法 预期 的 情形 。 但 是 , 当 任 务 继续 进 行 时 ,工作 
人 员 将 变 得 更 熟练 。 首 先 ,这 个 工作 人 员 从 培训 中 获 益 ,但 当 工 作 人 员 越 来 越 
熟悉 工作 参数 时 ,附加 的 培训 产生 的 收益 也 越 来 越 少 。 因 此 , 这 个 工作 人 员 将 
达到 完成 这 个 任务 的 效率 的 顶峰 。 模 拟 这 个 过 程 所 得 到 的 模型 常常 称 为 "学习 
曲线 ”, 因 为 心理 学 家 使 用 模拟 这 个 动态 过 程 的 函数 来 描述 经 验 或 培训 与 工作 
效率 之 间 的 关系 。 一 个 人 的 工作 经 验 或 受到 的 培训 越 多 ,那么 ,这 个 人 的 工作 
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效率 也 越 高 。 效 率 随 着 时 间 的 增加 将 趋 近 于 一 个 上 限 。 
请 考虑 另 一 个 具有 相似 动态 过 程 的 例子 。 当 新 闻 开 始 报道 一 个 事件 时 , 许 
多 人 会 知道 这 件 事 , 因 为 最 初 没 有 人 知道 。 但 随 着 时 间 的 推移 ,初次 得 知 这 个 
新 闻 的 人 越 来 越 少 ,因为 越 来 越 少 的 人 不 知道 这 件 事 。 因 此 ,这 个 新 闻 传 播 的 
速度 和 不 知道 它 的 人 数 呈 比例 。 这 也 是 一 个 学 习 过 程 ,在 这 个 过 程 中 ,学 习 是 
根据 总 体 中 有 多 少 人 获知 这 个 新 闻 传 播 的 信息 来 测量 的 。 最 终 , 如 果 媒 体 继 续 
播放 一 则 新 闻 , 则 越 来 越 少 的 人 不 知道 这 则 新 闻 。 我 们 可 以 说 ,不 知道 这 则 新 
闻 的 人 数 随 着 时 间 的 变化 趋 近 于 一 个 上 限 , 这 则 新 闻 的 持续 传播 将 对 初次 获悉 
这 则 新 闻 的 人 数 呈 递减 的 效应 。 
这 类 过 程 通常 用 方程 2. 6 这 样 的 微分 方程 来 模拟 。 有 时 ,不 存在 相互 作用 
成 分 的 扩散 模型 也 可 用 这 个 方式 来 模拟 (Coleman，1964:43)。 在 学 习 模 型 中 ， 
HEE y 表示 具有 某 种 特征 的 人 群 的 数量 ,例如 获悉 某 则 新 闻 的 人 数 ; 增 长 过 
程 的 上 限 可 以 用 U 表示 ; U 一 y 表示 不 具有 这 种 特征 的 人 数 ; 最 后 ,参数 a 表示 
没有 这 种 特征 的 人 变 成 具有 这 种 特征 的 人 的 速率 : 
dy/dt = a(U— y) [2. 6] 
方程 2. 6 通过 分 离 变量 法 可 以 写成 ; 
[1/(U— y) ]dy = adt 


对 方程 2. 6 两 边 同 时 积分 ， 


[UU -ydy = faai 


得 到 : 
—In|U—y|=at+C 
其 中 ,C 是 积分 得 到 的 常数 。 
注意 ,由 于 y 不 可 能 超过 它 的 上 限 , 因 此 U 一 yy 永远 是 正 值 。 这 并 不 是 一 个 
算术 结果 ,而 是 我 们 实际 问题 的 特定 结果 。 因 此 ,我 们 可 以 删除 这 个 绝对 值 符 
号 ,方程 变 成 : 
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—In(U— y) = at +C 
或 
ln(U — y) =— at — C 
进而 得 到 : 
U—y= ete" 
对 上 式 再 做 变换 ,可 以 得 到 : 
y =U — e e" 
由 于 e “是 常数 ,所 以 我 们 可 以 把 上 式 写 成 模型 的 通 解 形式 ,如 方程 2.7 所 示 : 
y = U — Be” [2.7] 
方程 2. 7 是 学 习 曲 线 的 函数 形式 。 注 意 , 当 :上 王 0 时 , yo =U—B, 随 着 时 间 
的 推移 (如 上 变 得 越 来 越 大 ), Be“ 将 逐渐 趋 近 于 0, 同 时 ,y 也 趋 近 于 U. 
这 个 过 程 的 时 间 序 列 图 如 图 2. 3 所 示 。 在 该 图 中 , a = 3, U = 1.6, y = 
0. 1。 注意 看 因 变 量 y 的 值 如 何 随 着 时 间 推 移 趋 近 于 UU 值 。 我 们 可 以 说 ,y 随时 
间 渐 渐 趋 近 于 其 上 限 U, 即 随 着 y 趋 近 于 其 上 限 值 U, y 与 U 之 间 的 距离 越 来 





因 变 量 
a 
© 


0.2 


0.0 
0.00 0.25 0.50 0.75 1.00 1.25 1.50 1.75 2.00 
时 间 
图 2.3 学 习 曲 线 
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越 小 ,但 y 永远 不 能 达到 其 上 限 U。 这 个 上 限 也 称 为 y 的 “均衡 值 ”, 因 为 它 是 y 
停止 变化 时 候 的 值 。 也 就 是 说 , 当 y = U 时, dy/dt = 0, 这 也 可 以 从 方程 2. 6 
中 看 出 。 

从 图 2. 3 可 以 看 出 ,变量 y 的 增长 率 dy/dt 随 着 时 间 ( 或 y 值 ) 的 增加 而 减 
少 ,这 就 意味 着 ,y 的 二 阶 导数 是 负 值 。 这 种 情形 称 为 经 历 “ 负 反馈 ”(Crosby， 
1987) , 即 因 变量 的 增加 导致 其 增加 的 速率 减少 。 因 变量 仍 在 增加 (由 于 dy/di 
是 正 值 ), 但 其 增加 的 速度 减缓 。 


logistic 曲线 


logistic 曲线 是 社会 科学 中 最 常用 的 模型 之 一 。 它 融合 了 学 习 曲 线 中 趋 近 
于 极 值 的 指数 增长 和 衰减 两 种 特征 。logistic 过 程 一 开始 呈现 正 反馈 系统 的 快 
速 增长 特征 ,之 后 呈现 负 反 馈 系 统 的 减速 增长 特征 。 

logistic 模型 的 形式 种 类 较 多 ,最 常见 的 如 方程 2. 8 所 示 : 


dy/dt = ay(U— y) [2.8] 


在 方程 2. 8 中 ,U 与 在 学 习 曲线 (图 2. 3) 中 一 样 是 y 的 上 限 。 当 y 值 相对 UU 和 较 
小 时 ,U — y 较 大 ,此 时 呈 指 数 增长 , 正 反 馈 占 主导 。 但 当 y fE F U 时， 
U 一 y 趋 近 于 0, 此 时 负 反馈 占 主导 。 

可 以 用 logistic 模型 来 描述 的 社会 过 程 常 常 包括 有 某 种 特征 的 人 群 和 没有 
这 种 特征 的 人 群 之 间 的 相互 作用 。 例 如 , 普 齐 沃 斯 奇 和 索 尔 斯 (1971) 利 用 lo- 
gistic 方程 来 描述 支持 和 不 支持 左翼 党 派 的 两 个 人 群 之 间 的 相互 作用 ;模拟 传 

染病 的 科学 家 也 常用 logistic 模型 来 描述 疾病 的 传染 过 程 及 染病 人 群 和 未 染病 

人 群 之 间 的 相互 影响 。 这 种 logistic 过 程 也 可 以 在 其 他 情形 中 出 现 。 例 如 , 布 
朗 (1995a: 第 6 章 、1994) 使 用 logistic 模型 来 描述 导致 环境 破坏 的 过 程 。 

方程 2. 8 是 可 分 离 的 ,将 其 积分 得 到 : 


| a ye y = fad [2. 9] 


要 求解 方程 2.9, 可 以 先 把 被 积 函数 变换 成 如 下 形式 : 
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TL 1( U j= L (U Aty) 
yU — y) U \yU— y) U \yU-— y) 





1/ U— ae SF 2 - 
= 0 hate) “ols re 





因此 ,方程 2.9 可 以 写成 : 


lah tuae =u] datg] gg” = faat 


两 边 积分 得 到 : 








1 二 
g” lvl pln |U y|=at+C 


将 方程 进行 变换 得 到 : 





Se, | 


由 于 U > y Ay 是 正 值 ,方程 2.10 中 的 绝对 值 符号 可 以 去 掉 。 令 方程 2.10 的 
两 边 同 时 乘 以 U, 并 求 e 的 宕 ,得 到 ; 








1 y | 1 
g” U—y| U 


Y a etU 一 CoUa 一 Me 
U—»% 


其 中 , M = & 是 常数 。 
求解 因 变 量 y, 得 到 : 
MUe™ U 





Y= THMO ` O/M" +1 [2.11] 
由 于 1/M 是 常数 , 令 K = 1/M, 那么 方程 2. 11 可 以 写成 : 
y= 了 | 


方程 2. 12 是 logistic 模型 通 解 的 最 终 形式 。 

从 上 文 可 以 看 出 ,得 到 logistic 曲线 的 通 解 比 得 到 指数 增长 模型 或 学 习 曲 
线 模型 的 通 解 更 难 。 这 就 是 微分 方程 的 特点 , 当 模 型 变 得 更 复杂 时 , 求 得 模型 
的 分 析 解 将 更 困难 ,而 且 可 能 不 能 求解 。 基 于 这 个 原因 ,我 们 经 常 使 用 数值 方 
法 来 求解 微分 方程 模型 。 
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logistic 模型 (方程 2. 8) 的 时 间 序 列 图 如 图 2. 4 所 示 。 这 个 图 可 以 通过 方程 
2. 12 或 数值 方法 来 计算 变量 的 值 。 图 2. 4 的 参数 和 图 2. 3 相同 : a = 3, U = 
1.6, y 一 0.1。 

比较 图 2. 3 和 图 2. 4 可 以 发 现 ,logistic 模型 在 增长 的 初始 阶段 与 指数 增长 
模型 很 类 似 。 学 习 曲 线 和 logistic 曲线 都 随时 间 的 推移 趋 近 于 上 限 U, 这 是 两 个 
模型 的 均衡 点 ,但 logistic 模型 具有 更 复杂 的 动态 结构 。 在 logistic 模型 的 时 间 
序列 图 起 始 阶段 , 正 反 馈 占 主导 ,此 时 模型 的 二 阶 导数 是 正 值 ,这 意味 着 ,模型 
的 一 阶 导数 (如 方程 2. 8 的 模型 ) 随 时 间 ( 或 > 值 ) 的 增加 而 增长 。 但 其 二 阶 导数 
很 快 变 成 负 值 , 此 时 负 反 馈 占 主导 ,一 阶 导数 随时 间 增 加 而 减少 。y 值 越 趋 近 于 
其 上 限 值 U, 其 一 阶 导 数 就 越 趋 近 于 0。 图 2.4 中 ,曲线 的 二 阶 导 数 为 0 的 点 称 
为 “ 折 点 ”, 这 个 点 把 模型 的 正 反 馈 和 负 反 馈 区 分 开 来 。 
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新 药 引 进 社区 的 例子 ,是 解释 一 阶 微 分 方程 特征 的 非常 好 的 实例 (Coleman， 
1964:43 一 46)。 他 们 的 研究 兴趣 主要 在 于 ,医生 怎么 把 新 药 介绍 给 他 们 的 病人 。 
这 个 模型 的 关键 变量 是 医生 是 否 融 入 了 医生 群体 ,通过 在 社区 的 抽样 调查 中 ， 
某 医生 被 其 他 医生 视 为 朋友 或 同事 的 计数 来 测量 。 在 这 个 变量 上 取得 较 高 分 
的 医生 被 视 为 "融入 ”, 而 取得 较 低 分 的 医生 被 视 为 "孤立 ”。 非 常 关键 的 是 , 融 
入 的 医生 比 孤 立 的 医生 平均 早 4 个 月 把 这 种 药物 介绍 给 病人 。 

有 两 种 假设 可 以 解释 这 种 现象 。 第 一 种 假设 是 融入 的 医生 的 专业 竞争 力 
更 强 , 即 他 们 更 了 解 医学 的 最 新 进展 。 因 此 ,导致 他 们 融入 的 因素 (专业 竞争 力 
和 同行 的 尊敬 ) 和 他 们 采用 新 药 的 因素 相同 。 由 于 他 们 更 融入 ,医生 更 可 能 了 
解 新 药 。 第 二 种 假设 是 他 们 经 常 和 同行 交流 ,因此 能 更 快 从 同行 那里 了 解 到 新 
药 的 使 用 。 而 孤立 的 医生 只 有 当 药 品 销售 员 推 销 上 门 时 , 才 可 能 知道 新 药 。 

为 了 检验 这 两 种 假设 ,我 们 采用 了 两 种 模型 :第 一 个 是 logistic 模型 ,如 方 
程 2.8 的 形式 ;第 二 种 是 学 习 模 型 (没有 交互 扩散 作用 ) ,如 方程 2. 6 的 形式 。 当 
这 些 模型 用 来 比较 医生 开始 开 新 药 预 计 花 费 的 时 间 的 数据 时 ,logistic 模型 更 好 
地 描述 了 融入 医生 的 行为 ,而 学 习 模 型 更 好 地 描述 了 孤立 医生 的 行为 。 基 于 这 
个 原因 ,我 们 拒绝 第 一 个 假设 ,接受 第 二 个 假设 。 融入 医生 比 孤 立 医生 更 快 使 
用 新 药 并 不 是 因为 融入 医生 的 专业 竞争 力 更 强 , 而 是 他 们 更 经 常 和 同行 交流 ， 
因此 通过 信息 交流 的 渗透 过 程 获 得 新 药 的 信息 。 在 分 析 这 个 例子 中 的 融入 医 
生 时 ,获得 信息 和 没有 获得 信息 的 交互 作用 是 logistic 模型 优 于 学 习 模 型 的 主 
要 之 处 。 学 习 曲 线 之 所 以 比 logistic 模型 更 好 地 模拟 了 孤立 医生 ,是 由 于 同行 
之 间 的 交互 作用 并 不 影响 这 些 医 生 引 进 新 药 的 时 间 。 








求解 微分 方程 的 数值 方法 


求解 微分 方程 的 数值 方法 存在 了 很 长 一 段 时 间 , 但 其 广泛 应 用 主要 归功 于 
计算 机 的 应 用 。 近 些 年 ,新 数值 方法 的 发 展 也 取得 了 很 大 进展 ,很 多 方法 比 老 
的 数值 方法 更 有 效 。Runge-Kutta 方 法 一 直 以 来 部 是 求 微分 方程 数值 解 的 主要 
方法 。 昌 然 这 种 方法 很 老 , 但 仍 很 实用 ,并 可 以 作为 任何 有 兴趣 用 数值 方法 求 
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解 微分 方程 的 读者 的 学 习 起 点 。 

本 部 分 将 介绍 3 种 Runge-Kutta 方法 :(1)Euler 法 ;(2) Heun 法 ;(3) 四 次 
Runge-Kutta 法 。Euler 法 实际 上 是 一 次 Runge-Kutta 法 , Heun 法 是 二 次 
Runge-Kutta 法 。Euler 法 和 Heun 法 实际 上 很 少 用 ,因为 四 次 Runge-Kutta 法 
更 精确 , 且 更 容易 应 用 。 但 了 解 Euler 法 和 Heun 法 可 以 帮助 解释 Runge-Kutta 
法 的 工作 原理 ,这 里 的 介绍 主要 起 启发 作用 。 

许多 社会 科学 家 可 能 发 现 , 四 次 Runge-Kutta 法 几乎 是 求解 所 有 微分 方程 
的 完美 方法 。 从 这 种 意义 上 讲 , 这 些 科学 家 可 能 不 需要 使 用 近来 新 的 数值 方法 
来 求解 微分 方程 。 但 是 ,一 些 科 学 家 可 能 仍然 发 现 最 新 的 方法 更 有 趣 , 或 更 能 
满足 他 们 的 需要 。 我 们 首先 用 胡 塞 因 。 科 洽 克 (Hiiseyin Kocak) 编 写 的 计算 机 
程序 “Phaser”(www. phaser. com) 来 介绍 这 些 方法 。 从 实际 的 角度 来 讲 , 除 了 
理解 怎么 用 四 次 Runge-Kutta 法 解决 微分 方程 外 ,许多 科学 家 不 需要 再 进一步 
了 解 其 他 方法 (在 介绍 微分 方程 的 许多 处 理 方法 时 ,都 会 讨论 Runge-Kutta 法 
的 重要 性 ,具体 可 参见 Blanchard et al. ,2006;Boyce & DiPrima, 1977: 第 8 章 ; 
Koçak, 1989), 


Euler 法 


当 使 用 数值 积分 Runge-Kutta 法 时 ,要 得 到 因 变 量 的 值 不 需要 得 到 微分 方 
程 的 分 析 解 。 当 微分 方程 组 中 ,变量 之 间 相 互 交互 时 ,RungeKutta 法 也 能 很 容 
易 求解 。Euler 法 是 所 有 Runge-Kutta 法 中 最 简单 的 一 种 ,很 容易 解释 。 

直观 地 讲 , 基 本 的 理念 是 微分 方程 (如 方程 1. 1 方程 2. 6 或 方程 2. 8) 自身 
是 因 变 量 随时 间 的 导数 。 作 为 导数 ,一 旦 我 们 提供 方程 右 侧 的 参数 值 ,就 知道 
因 变 量 的 值 是 增加 还 是 减少 。Euler 法 是 当 导 数 为 正 值 时 , 微 增 因 变量 的 值 来 
找到 因 变 量 的 下 一 个 值 。 当 导数 为 负 值 时 , 因 变 量 的 值 是 下 降 的 ,因此 Euler 法 
是 微 减 因 变量 的 值 来 得 到 因 变 量 的 下 一 个 值 。 可 以 看 出 ,其 原理 比较 简单 : 当 
导数 为 正 值 时 ,增加 y; 当 导 数 为 负 值 时 ,减少 y。 

具体 计算 的 机 制 也 没有 比 原理 难 多 少 。 我 们 需要 找到 一 种 方法 来 从 点 
Gs yy) 到 点 (inown，ynex )。 首 先 ,我 们 需要 找到 一 种 方法 在 时 间 轴 上 从 t F tae o 
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为 了 达到 这 个 目的 ,我 们 使 用 一 个 微 增 量 沿 着 时 间 轴 ”* 疏 行 ”。Euler 法 中 普遍 
使 用 的 微 增 量 是 0. 01。 如 果 微 增 量 更 小 , 则 得 到 的 精度 将 更 高 。 后 面 我 们 将 看 
到 ,其 他 的 Runge-Kutta 法 使 用 的 微 增 量 更 大 。Euler 法 使 用 的 微 增 量 比 其 他 
的 小 的 原因 主要 在 于 ,Euler 法 的 精确 度 更 低 , 因 此 每 次 移动 的 量 也 更 小 。 这 个 
微 增 量 也 称 为 “ 步 长 ”, 我 们 可 以 把 它 想象 成 当 我 们 沿 着 时 间 轴 移动 时 ,每 次 移 
动 的 距离 。 因 此 ,从 时 点 0 到 时 点 1, 如 果 每 次 只 移动 0. 01, 则 需要 移动 100 步 。 
这 可 以 用 公式 ha = t+ At 来 表示 ,其 中 ,At 表示 步 长 。 

现在 我 们 开始 计算 。 沿 着 时 间 轴 的 每 一 步 的 移动 ,我 们 需要 计算 因 变量 y 
的 值 。 我 们 根据 给 定 的 因 变量 的 现 值 计算 因 变 量 的 下 一 个 值 。 首 先 从 y 的 初 
始 值 开始 ,我 们 将 根据 y 的 导数 的 符号 (如 y 是 增加 还 是 减少 ) 来 获得 y 的 下 一 
个 值 。 从 这 个 值 出 发 , 沿 着 时 间 轴 再 往 下 走 一 步 , 获 得 y 的 男 一 个 值 ,这 样 一 直 
往 下 走 。 我 们 一 直 重 复 这 个 过 程 ,直到 时 间 序 列 满足 我 们 的 要 求 。 这 明显 需要 
通过 包括 “循环 ”路 径 的 计算 机 程序 来 计算 。“ 循 环 ” 是 一 种 可 以 一 遍 又 一 遍 重 
复 同 一 过 程 的 方法 。 每 一 次 循环 可 以 得 到 y 的 一 个 新 值 ,保存 为 下 一 步 使 用 ， 
然后 再 重复 一 次 循环 ,又 可 以 得 到 一 个 y 值 ,再 一 遍 又 一 遍地 重复 。 

Euler 方法 的 公式 如 方程 2. 13 所 示 : 


Ysa = Yh(dy/di) [2.13] 


方程 2. 13 包含 在 计算 因 变量 > 值 的 程序 的 循环 路 径 中 。 在 方程 2. 13 中 , 右 侧 
的 y 值 是 上 次 循环 获得 的 y 值 ;ys 是 本 次 循环 中 y 的 新 值 , 它 将 在 下 次 循环 中 
作为 现 值 ; 参 数 疡 是 步 长 。 这 里 ,我 们 用 步 长 乘 以 导数 (这 是 原始 模型 ,如 方程 
1. 1 所 示 ) ,并 加 上 y 的 现 值 来 得 到 y 的 新 值 。 当 我 们 计算 得 到 y 的 新 值 时 , 需 
要 记 住 保存 y 的 现 值 和 新 值 , 然 后 把 y 的 新 值 设 为 y 的 现 值 , 以 便 循 环 能 够 实 
H. 我们 也 需要 保存 时 间 的 现 值 ,这 是 时 间 的 上 一 个 值 加 上 一 个 步 长 hn。 编写 
这 种 计算 的 编码 (用 SAS 编写 ,也 可 以 用 其 他 程序 来 写 ) 如 下 所 示 : 

DATA, 

A=0.3; *x 人 参数 值 ; 

H=0.01; x HK; 
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Y= 0.01; x AXE Y 的 初始 条 件 ; 

TIME = 0; x 时 间 的 初 值 ; 

DO LOOP = 1 TO 2000; x 循环 的 开始 ; 

DERIV = A * Y; x 微分 方程 模型 ; 

YNEXT = Y + (Hx DERIV) ; x*Euler 法 ; 

TIME = TIME +H; x 微 增 时 间 ; 

OUTPUT; x 输出 循环 数据 以 便 能 画图 ; 

Y = YNEXT; x* 把 通过 Euler 法 计算 得 到 的 新 Y 值 设 为 了 Y 值 ; 

END; * 这 个 循环 结束 ; 

SYMBOL1 COLOR = BLACK V = NONE F = CENTB I = JOIN, 

RPOC GPLOT, 

PLOT YNEXT x TIME; 

TITLE “iz FA Euler 方法 的 时 间 序 列 ”; 

RUN; 

QUIT; 

基于 直线 的 斜率 是 在 任何 一 个 时 点 的 模型 曲线 的 切线 ,Euler 法 有 一 种 几 
何 解释 。 模 型 本 身 是 一 个 导数 ,导数 的 值 即 切线 的 斜率 。 从 直线 斜率 的 定义 来 
讲 , 我 们 可 以 说 : 





Vnext — Y = next — Y = 
Yen 2 = Yee Y= fle, y) [2.14] 


方程 中 的 At，y) 是 微分 方程 模型 。 如 果 我 们 变换 一 下 方程 2. 14, 可 以 得 到 : 
Yna = Yt f(t, yAt 


这 就 是 方程 2. 13 给 出 的 Euler 法 公式 。 一 些 读者 可 能 会 注意 到 ,Euler 法 也 等 
同 于 对 原始 微分 方程 模型 的 一 阶 二 项 式 泰勒 近似 (Blanchard et al. , 2006;641; 
Atkinson, 1985:310—323), 

到 目前 为 止 , 我 们 应 该 很 清楚 为 什么 Euler 法 得 出 的 结果 不 精确 。 因 为 随 
着 时 间 向 前 移动 每 一 步 ,Euler 法 都 是 沿 着 模型 曲线 在 某 点 上 的 切线 ,而 不 是 沿 
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着 模型 的 曲线 前 行 。 步 长 越 大 ,Euler 法 偏离 真实 曲线 的 潜在 风险 越 大 (这 主要 
取决 于 曲线 的 弯曲 程度 ) 。 上 一 步 产生 的 偏 误 将 累计 到 这 一 步 ,这 样 ,问题 会 一 
直 累 积 。 减 少 步 长 能 减少 这 个 问题 ,但 最 好 的 解决 方法 是 采用 很 好 的 函数 来 拟 
合 。 四 次 Runge-Kutta 法 是 在 Euler 法 的 基础 上 形成 的 , 它 能 得 出 更 精确 的 
结果 。 


Heun 法 


Heun 法 有 时 也 称 为 “改进 的 Euler 法 ”, 是 二 次 Runge-Kutta 法 。 一 些 研究 
人 员 也 许 会 问 : 在 实际 应 用 中 一 般 使 用 Runge-Kutta 法 ,为 什么 还 要 费 周折 来 
介绍 Heun 法 呢 ? 在 这 里 介绍 Heun 法 主要 是 因为 ,通过 解释 二 次 方法 将 更 有 
利于 介绍 更 高 阶 的 Runge-Kutta 法 的 工作 原理 。 我 们 并 不 会 深入 介绍 很 多 细 
节 问 题 ,但 值得 注意 的 是 , Runge-Kutta 法 的 次 数 与 其 误差 的 特征 有 关 (Blan- 
card et al. , 2006:646—647; Zill, 2005:373—374) ,甚至 一 个 二 次 Runge-Kutta 
法 的 精度 相对 于 Euler 法 来 说 有 很 大 改进 。 

Heun 法 的 基本 概念 非常 简单 。 在 使 用 Euler 法 时 ,我 们 利用 微分 方程 得 出 
因 变 量 的 值 在 曲线 的 特定 点 上 是 增加 还 是 减少 。 因 变量 的 增加 量 或 减少 量 取 
AF y 的 导数 值 , 即 微分 方程 本 身 。Heun 法 将 给 出 一 个 更 好 地 计算 因 变 量 的 
增加 量 和 减少 量 的 方法 。 它 先 计算 y 的 两 个 导数 ,然后 求 这 两 个 导数 的 平均 
值 , 再 用 这 个 平均 值 乘 以 步 长 (和 Euler 法 的 做 法 一 样 ) 得 到 y 的 新 值 。 由 于 
Heun 法 比 Euler 法 更 精确 ,所 以 可 以 使 用 更 大 的 步 长 ,从 而 增加 计算 的 速度 。 

更 确切 地 说 ,Heun 法 一 开始 是 应 用 Euler 法 来 计算 。 也 就 是 说 ,我 们 使 用 
Euler 法 根据 y 的 现 值 来 得 到 y 的 新 值 。 这 意味 着 ,我 们 把 Euler 法 应 用 到 点 
(wo，yo)。 然 后 ,我 们 需要 使 用 Euler 法 使 用 的 导数 值 ,因此 需要 把 它 保 存 , 记 为 
m。 现 在 我 们 有 点 Co，yo) 和 (tron ，yoen ) ,第 二 个 点 是 应 用 Euler 法 得 到 的 。 这 
次 ,我 们 再 使 用 Euler 法 ,但 这 次 是 应 用 到 点 Cow，ynen )。 此 时 ,我 们 也 需要 使 


Euler 法 ,但 这 次 ,我们 使 用 m 入 的 平均 值 作为 导数 值 。 因 此 ,我 们 通过 下 式 
得 到 y 的 新 值 : 
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Ye = yth(2E*) [2.15] 


其 中 ,h 是 步 长 , [Cm 十 n)/2j] 是 从 两 个 不 同 的 y 计算 得 到 的 两 个 导数 的 平均 值 ， 
第 二 个 y 值 是 根据 原始 的 > 值 使 用 Euler 法 得 到 的 。 

Heun 法 的 几何 学 原理 与 应 用 梯形 法 则 来 近似 估计 曲线 下 面 的 面积 类 似 ， 
感 兴 趣 的 读者 可 以 在 布 兰 查 德 等 人 (2006:642 一 644) 的 文献 中 找到 相关 的 处 理 
Fik. Heun 法 的 另 一 种 几何 学 解释 是 ,开始 时 用 Euler 法 计算 得 到 的 一 阶 导数 
m 产生 的 误差 ,可 以 由 第 二 次 应 用 Euler 法 得 到 的 导数 nn 弥补。 这 些 导 数 (m 和 
n) 的 均值 用 于 方程 2. 15 时 ,将 得 到 一 个 更 好 的 y 值 。 读 者 可 以 在 齐 尔 (Zill， 
2005:370 一 371) 的 论述 中 找到 关于 这 个 问题 的 更 详细 的 讨论 。 从 这 个 推理 中 可 
以 看 出 ,方程 2. 15 中 的 导数 n 是 用 来 纠正 使 用 导数 m 带 来 的 误差 。 这 也 是 有 
时 称 Heun 法 为 “预测 修正 法 ”的 原因 。 一 些 读者 也 注意 到 ,Heun 法 类 似 于 原始 

微分 方程 模型 的 二 次 泰勒 展 式 的 应 用 (Zill，2005:374) 。 


四 次 Runge-Kutta 模型 


四 次 Runge-Kutta 法 是 求解 一 阶 微分 方程 的 精确 方法 ,而 且 是 大 部 分 时 候 
的 主要 使 用 方法 。 当 Heun 法 通过 使 用 两 个 斜率 的 均值 来 得 到 因 变量 的 值 时 ， 
四 次 Runge-Kutta 法 使 用 4 个 斜率 的 加 权 平 均值 来 得 到 因 变 量 的 值 。 这 个 方法 
常 简写 成 “RK4”。 
RK4 法 的 机 制 非常 简单 ,但 比 Heun 法 的 计算 处 理 更 麻烦 。RK4 法 最 常用 
的 公式 如 下 : 
Yna = Y F Ch/6) (ki 二 2kz + 2k; + hy) 


其 中 ， 
ki fit, y) 


kı = flt+h/2, y+ (h/2)k,] 
ks = f[t+h/2, y+ (h/2)k:] 


= flt+h, y+hk;] 
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WER, k 和 局 的 值 在 离 原始 起 点 (1。，y, ) 半 步 长 处 计算 得 到 ,ki 值 在 起 点 处 
计算 得 到 ,上 值 在 离 起 点 一 步 长 处 计算 得 到 。RK4 法 的 几何 学 解释 可 以 参考 布 
兰 查 德 等 人 (2006:650 一 651) 的 研究 。 简 言 之 ,从 上 面 的 方程 可 以 看 出 ,yx 值 
是 使 用 类 似 于 Euler 法 的 方法 计算 得 到 的 ,两 者 的 差别 在 于 并 不 用 一 个 导数 ,而 
是 用 4 个 导数 , 且 中 间 两 个 导数 的 权重 加 倍 (总 权 数 为 6, 这 就 是 为 什么 我 们 除 
以 6 得 到 均值 ) 。 我 们 除了 使 用 4 个 导数 的 加 权 平 均 数 ,还 把 这 个 均值 乘 以 步 长 
,然后 把 这 个 乘积 和 y 的 原始 值 相 加 得 到 y 的 新 值 。 读 者 应 该 注意 到 ,在 一 些 
课本 中 ,RK4 法 的 公式 使 用 符号 rk!、rks、rks 和 rk ,而 不 是 使 用 ki 到 。 


本 章 小 结 


本 章 主要 介绍 了 一 阶 微分 方程 。 首 先 介绍 了 求解 线性 一 阶 微分 方程 分 析 
解 的 方法 ,其 重点 放 在 分 离 变量 法 的 介绍 。 当 微分 方程 可 以 通过 分 离 变量 法 求 
解 时 ,这 是 一 个 非常 简单 直接 的 获得 方程 的 方法 ,通过 这 个 方程 可 以 得 到 之 和 y 
的 值 ,从 而 可 以 用 于 画图 或 分 析 。 当 分 离 变 量 法 不 适用 时 ,我 们 可 以 使 用 积分 
的 数值 方法 。 在 所 有 的 一 阶 微分 方程 中 ,我 们 介绍 了 4 种 “理想 类 型 ”: (1) 指 数 
增长 ;(2) 指 数 衰减 ;(3) 学 习 曲 线 和 非 交 互 扩 散 ; (4) logistic 曲线 。 我 们 列举 了 
一 个 经 典 的 社会 学 例子 来 比较 前 面 的 第 三 类 和 第 四 类 微分 方程。 本 章 接 下 来 
介绍 了 3 种 求解 微分 方程 的 数值 方法 。Euler 和 Heun 法 用 来 帮助 介绍 最 常用 
的 四 次 Runge-Kutta 法 。 还 存在 许多 其 他 的 数值 方法 ,但 四 次 Runge-Kutta 法 
作为 一 个 好 的 应 用 起 点 ,适用 于 很 多 场合 。 数 值 方法 特别 常用 ,因为 它们 几乎 
适用 于 任何 真实 世界 的 情形 ,不 管 是 线性 情形 还 是 非 线性 情形 。 不 定 积分 的 分 
析 法 一 般 不 适用 于 大 部 分 非 线性 模型 。 当 遇 到 非常 复杂 (不 正常 ) 的 情形 时 , 即 
当 微 分 方程 既 不 能 通过 分 析 法 ,也 不 能 通过 数值 方法 求解 时 ,我 们 必须 认真 研 
究 这 个 方程 的 数学 形式 。 


第 3 章 | 一 阶 微分 方程 组 


简单 微分 方程 只 有 一 个 因 变 量 。 但 在 这 个 世界 上 ,很 少 有 事情 能 孤立 地 研 
究 。A 影响 B, B 影 响 A( 或 C) 等 也 很 正常 。 基 于 这 个 原因 ,我 们 研究 方程 组 。 
在 微分 方程 的 应 用 中 ,方程 组 是 最 重要 的 领域 之 一 。 本 章 主要 研究 一 阶 微分 方 
程 组 。 这 是 微分 方程 组 的 一 个 重要 类 型 ,因为 高 阶 非 自 治 微分 方程 可 以 表示 成 
一 阶 微分 方程 组 。 实 际 上 ,一 阶 微分 方程 组 可 以 用 于 数值 分 析 高 阶 微分 方程 
组 ,如 用 四 次 Runge-Kutta(RK4) 法 。 因 此 ,一 阶 微分 方程 对 研究 一 般 微 分 方程 
的 应 用 非常 有 用 。 

有 两 种 一 阶 微分 方程 组 :线性 和 非 线性 。 我 们 能 用 定性 分 析 数 值 法 来 分 析 
线性 方程 组 。 分 析 法 包括 找到 微分 方程 组 的 确切 解 ,这 类 似 于 我 们 使 用 分 离 变 
量 法 求解 一 些 简单 的 微分 方程 。 然 而 , 非 线性 方程 常用 定性 数值 法 来 分 析 , 因 
为 大 部 分 非 线性 方程 组 很 难得 到 确切 的 通 解 。 分 析 法 也 同样 适用 于 线性 方程 ， 
因为 这 些 方法 能 帮助 我 们 了 解 这 些 系统 的 行为 类 型 ,这 些 行 为 可 能 变化 较 大 。 
需要 注意 的 是 , 非 线性 系统 的 行为 模式 和 线性 系统 非常 类 似 , 因 此 ,了 解 线性 系 
统 的 行为 特征 能 帮助 我 们 了 解 非 线性 系统 。 

因为 定性 分 析 方法 既 适 用 于 线性 方程 ,也 适用 于 非 线 性 方程 ,所 以 这 些 方 
法 被 广泛 用 于 研究 所 有 的 微分 方程 组 。 而 且 , 在 社会 科学 中 ,构建 社会 科学 动 
态 模型 时 ,经 常 要 设 定 非 线性 成 分 。 例 如 , 当 一 个 人 群 和 另 一 个 人 群 相互 影响 
时 (如 工作 的 人 和 没有 工作 的 人 接触 ), 则 在 模型 设 定时 需要 加 上 非 线 性 部 分 
(Przeworski & Soares, 1971; Przeworski & Sprague，1986) 。 本 章 的 焦点 是 
用 于 研究 一 阶 微分 方程 组 的 定性 数值 方法 。 
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猎 食 模型 


洛 特 卡 和 沃 尔 泰 拉 的 狂 食 模型 是 介绍 一 阶 微分 方程 组 基本 概念 的 最 合适 
的 方程 组 (Hirsch & Smale, 1974:258 一 265; Kocak，1989: 121 一 122; May, 
1974) 。 虽 然 模型 是 有 关 和 群体 生物 学 的 ,但 模型 中 的 线性 和 非 线性 部 分 广泛 应 
用 在 许多 社会 科学 领域 ,建议 读者 仔细 研究 这 个 模型 。 关 于 这 个 模型 的 介绍 ， 
我 将 保持 群体 生物 学 的 解释 ,虽然 我 在 后 面 会 把 这 个 模型 的 讨论 扩展 到 人 类 社 
会 学 实例 中 。 

猎 食 模型 的 基本 概念 是 存在 两 个 相互 猎 食 的 群体 。 举 一 个 现实 的 例子 , 当 
有 食物 时 ,兔子 生 小 兔子 ,兔子 数量 增加 。 当 人 兔子 数量 增加 时 ,狐狸 会 有 更 多 食 
物 吃 ,这 又 导致 狐狸 数量 增加 。 最 后 ,狐狸 数量 增加 太 多 以 至 于 兔子 数量 开始 
减少 ,而 狐狸 由 于 食物 (兔子 ) 减 少 而 饿 死 。 当 狐狸 数量 减少 时 , 兔子 数量 的 增 
加 就 不 受 什 么 限制 了 ,因此 兔子 数量 又 开始 增加 ,从 而 狐狸 数量 开始 增加 ,就 这 
样 一 直 循环 下 去 。 

这 是 个 封闭 系统 的 例子 ,从 某 种 意义 上 讲 ,影响 这 个 系统 的 所 有 因素 都 在 
这 个 系统 内 。 没 有 外 在 因素 会 影响 狐狸 和 兔子 的 数量 。 一 些 理论 学 家 也 称 这 
个 系统 为 “孤立 系统 ”。 在 物理 学 中 ,“ 封 闭 系统 ”和 “孤立 系统 ”这 两 个 术语 是 存 
在 差异 的 。 例 如 ,封闭 系统 可 以 和 外 界 交 换 热 和 功 ,但 孤立 系统 不 能 。 两 种 系 
统 都 不 能 和 外 界 进行 物质 交换 。 在 这 里 ,这 种 差异 并 不 会 影响 我 们 的 结果 ,这 
两 个 概念 可 以 交换 使 用 。 开 放 系 统 是 指 , 外 在 因素 能 影响 变量 的 动态 过 程 ,在 
这 个 例子 中 ,数量 可 能 由 于 这 些 因素 增加 或 减少 。 

我 们 把 兔子 数量 记 为 X ,狐狸 数量 记 为 了 , 则 这 种 猎 食 关系 可 以 通过 方程 
3. 1 和 方程 3. 2 来 表示 : 

dX /dt = aX — bXY — mX’ [3. 1] 
dY /dt = cXY — eY — nY” [3:2] 


其 中 ,a、b、c、e、n、m 是 常数 。 这 两 个 方程 组 成 了 两 个 非 线性 一 阶 微分 方程 组 


微分 方程 :一 种 建 模 方法 | 


的 相互 依存 的 系统 。 这 个 方程 组 是 非 线 性 的 ,因为 两 个 方程 中 都 存在 交互 项 和 
二 次 项 (如 XY、X “和 Y“)。 这 两 个 方程 又 是 互 为 条 件 的 ,因为 变量 X 和 YY 同 
时 出 现在 两 个 方程 中 ,也 就 意味 着 dY/dt 同时 依赖 于 X MY, dX/dt 也 一 样 。 
洛 特 卡 (1925) 和 沃 尔 泰 拉 (1930、1931) 的 经 典 猎 食 模 型 有 许多 一 般 形 式 , 下 面 
将 介绍 方程 参数 m 和 nn 为 0 的 方程 形式 。 

在 上 面 的 方程 中 ,X A Y 都 随时 间 发 生变 化 。 在 经 典 的 猜 食 模型 中 , 兔子 
数量 呈 指 数 增 长 (ecX) ,直到 它们 被 狐狸 吃 掉 ( 一 bX 站 或 数量 增加 到 食物 能 支持 
的 极限 (一 mX”)。 只 有 当 有 人 兔子 吃 的 时 候 , 狐 狸 数 量 才 能 增长 (cXY)。 狐 狸 数 
量 的 减少 是 由 于 自然 因素 (一 e 站 或 由 于 增长 过 度 而 没有 足够 的 兔子 可 以 吃 (一 
nY’). 

猎 食 模型 和 方程 2. 8 描述 的 logistic 模型 的 设 定之 间 的 共性 值得 我 们 注意 。 
当 没 有 狐狸 时 ,方程 3. 1 可 以 写成 : 

dX/di = X(a— mX) [3.3] 
方程 3. 3 和 方程 2.8 之 间 的 联系 可 以 从 下 面 的 数学 推导 中 看 出 来 : 
dX /dt = aX[1 — (m/a)X] 
dX /dt = a(m/a)X[a/m— X] 
dX/dt = mX[U — X] 


其 中 , U = a/m, 然而 ,饱和 的 猎 食 模型 通过 添加 乘积 项 XY 来 说 明 两 个 物种 之 
间 的 交互 作用 ,这 就 是 该 模型 与 简单 logistic 模型 的 主要 区 别 。 

同时 需要 注意 的 是 ,方程 3. 3 有 一 个 logistic 上 限 a/m。 这 是 通过 把 方程 
3.3 RH OCH X 达到 极限 时 ,其 导数 的 值 为 0) ,然后 求解 X 得 到 的 。 同 样 , 当 
没有 兔子 时 ,方程 3. 2 显示 狐狸 数量 的 下 限 是 0( 因 为 增长 仅 发 生 于 存在 兔子 的 
时 候 )。 这 些 也 称 为 因 变量 的 “均衡 值 ”下面 将 进行 更 深入 的 讨论 。 

在 一 般 情况 下 ,介绍 猎 食 模型 时 ,都 会 忽略 方程 3. 1 和 方程 3. 2 中 由 于 拥 
挤 和 资源 不 足 产生 的 极限 项 (xzX “和 nY”), 从 而 主要 关注 两 种 人 群 是 怎样 交 
互 作用 的 。 其 中 ,一 种 表示 这 两 个 变量 之 间 的 交互 作用 的 方式 是 时 间 序 列 
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图 ,如 图 3. 1 所 示 。 在 这 个 图 中 , 纵 轴 的 刻度 是 任意 的 ,把 数量 设 成 几 百 个 会 
真实 些 。 画 这 个 图 时 ,参数 mr 和 n 都 设 为 0。 这 里 需要 注意 ,狐狸 根据 兔子 的 总 
数 来 “追赶 "兔子 ,狐狸 数量 的 变化 总 是 根据 兔子 数量 的 变化 来 调整 ,并 滞后 于 
兔子 数量 的 变化 。 
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图 3.2 受到 资源 限制 的 猎 食 模型 时 间 序 列 图 
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根据 由 于 拥挤 和 资源 有 限 等 因素 引起 的 限制 项 (mX 和 nY ) 的 饱和 猎 
食 模型 得 到 的 时 间 序 列 图 呈现 出 完全 不 同 的 特征 ,如 图 3. 2 所 示 。 请 注意 ,在 
这 个 时 间 序 列 图 中 , 猎 食 者 和 猎物 的 数量 最 后 都 稳定 在 两 个 均衡 值 ,在 本 书 
HAX, Y’). 


相位 图 


当 处 理 微分 方程 组 时 ,我 们 一 般 会 想 知道 ,一 个 变量 是 怎么 随 着 男 一 个 变 
量变 化 的 。 从 某 种 意义 上 讲 , 时 间 在 这 里 起 了 妨碍 作用 。 不 过 ,我 们 可 以 用 方 
程 3. 1 除 以 方程 3. 2 来 消除 时 间 项 ,如 方程 3. 4 所 示 : 


dX _ aX —bXY — mX’ [3 4] 
dY cXY — eY — nY? ` 





用 方程 3. 4 可 以 得 到 不 同 的 分 析 , 但 更 常见 的 情形 是 通过 图 形 技术 来 研究 
没有 时 间 轴 时 ,系统 变量 之 间 的 联合 行为 。 这 些 技术 中 最 基本 的 一 种 是 系统 的 
相位 图 。 我 们 使 用 相位 图 来 画 不 包括 时 间 变 量 时 ,变量 X 和 Y 之 间 的 序列 动态 
图 。 图 3. 3 描述 了 一 个 系统 的 相位 图 , 它 与 图 3. 1 相对 应 ,参数 m 和 n 都 设 为 
0, 即 不 存在 拥挤 和 资源 限制 的 情形 。 

在 图 3. 3 中 ,不 存在 时 间 轴 。 更 确切 地 讲 , 我 们 现在 显现 出 来 的 是 X A Y 
之 间 独 立 于 时 间 的 系列 变化 。 这 个 图 中 的 椭圆 曲线 称 为 “轨迹 ”, 这 个 轨迹 存在 
于 两 个 变量 的 系统 “相位 空间 ”中 。 如 果 把 时 间 包 括 在 内 , 则 要 加 入 第 三 个 轴 ， 
这 个 轴 垂 直 于 纸 面 向 外 。 这 时 轨迹 将 像 火箭 启动 时 , 烟 的 轨迹 那样 螺旋 式 旋 出 
纸 面 ,而 不 是 像 图 3. 3 所 展示 的 平面 曲线 。 

注意 图 3. 3 轨迹 的 摇摆 特征 。 轨 迹 的 椭圆 轨道 的 位 置 和 大 小 由 起 始 条 件 决 
定 , 在 这 个 图 中 , (X, Yo) = (1, 0.2). 除了 唯一 的 一 点 例外 ,模型 不 管 从 系统 
的 哪里 开始 起 步 , 猎 食 者 和 猎物 数量 的 循环 轨迹 都 遵循 相同 的 路 径 。 当 然 , 这 
是 假设 在 一 个 纯 确 定性 世界 中 ,在 现实 中 是 不 可 能 出 现 的 。 在 一 般 情况 下 ,在 
这 个 路 径 上 会 加 入 随机 性 的 因素 ,但 模型 中 潜在 的 确定 性 系统 的 循环 特征 保持 
不 变 。 
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猎 食 动物 群体 


o 零 向 量 





00 02 04 06 08 LO 12 14 
猎物 群体 
图 3.3 没有 资源 限制 的 猎 食 模型 的 相位 图 


如 图 3. 3 所 示 的 椭圆 轨迹 的 唯一 一 处 例外 是 一 个 "均衡 点。 均衡 点 是 因 变 
量 停止 发 生变 化 的 地 方 , 也 是 导数 (方程 3. 1 和 方程 3. DEF 0 的 地 方 。 

在 图 3. 3 中 ,均衡 点 落 在 椭圆 轨迹 的 中 间 某 处 ,我 们 可 以 通过 同时 求解 这 两 
个 方程 得 到 X AY 的 坐标 。 由 于 图 3. 3 中 ,参数 ”和 ?7 都 设 为 0, 因此 ， 


0 = aX — bXY 


0 = cXY — eY 


这 就 得 到 了 公式 X, Y* ) = (e/c, a/b). 位 于 椭圆 轨迹 内 部 的 均衡 点 称 为 “中 
心 ”, 这 种 均衡 点 是 稳定 的 (下 面 将 讨论 这 个 特征 )。 为 了 得 到 图 3. 3, 把 上 式 的 
参数 设 为 : a 二 1, 5 二 1,c 二 3,e 二 1。 因 此 ,这 个 系统 的 均衡 点 是 (1/3, 1)。 这 
个 系统 也 有 另 一 个 均衡 点 (0, 0) ,但 这 个 点 没有 多 大 意义 。 

除了 确定 原始 模型 的 参数 ,处 理 任何 微分 方程 系统 最 重要 的 两 点 是 : (1) 确 
定 系统 的 均衡 点 ;(2) 确 定 这 个 均衡 点 是 否 稳定 。 图 3. 3 中 有 一 个 很 明确 的 均衡 
点 ,因此 我 们 完成 了 第 一 个 目标 。 关 于 第 二 个 目标 ,我 们 会 注意 到 ,一 个 不 稳定 
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的 均衡 点 往往 排斥 轨迹 线 。 排 斥 程度 可 快 可 慢 , 慢 则 慢 慢 漂 离 均衡 点 。 但 如 果 
均衡 点 附近 的 轨迹 并 不 随时 间 远 离 , 则 这 个 均衡 点 是 稳定 的 。 稳 定 的 均衡 点 又 
可 分 为 引力 均衡 点 和 中 立 均衡 点 。 在 相位 图 中 ,引力 均衡 点 把 轨迹 引 向 自己 ， 
中 立 均 衡 点 既 不 排斥 也 不 吸引 轨迹 。 图 3. 3 的 向 量 X, Y* ) = (e/c, a/b) 是 
中 立 均 衡 点 。 如 果 将 图 3. 3 所 示 的 系统 的 初始 条 件 设 为 点 (e/c,， a/b) , 则 这 个 
系统 将 不 会 变 , 而 且 所 有 的 值 都 会 永远 固定 在 这 个 点 上 ,但 任何 远离 这 个 点 的 
随机 扰动 都 会 导致 前 面 所 示 的 波动 。 由 于 这 样 的 波动 并 不 会 持续 且 系 统 地 远 
离 这 个 均衡 点 ,所 以 这 个 均衡 点 是 稳定 的 。 
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猎物 群体 
图 3.4 存在 资源 限制 的 猎 食 模型 相位 图 


如 果 我 们 把 猎 食 模型 中 的 参数 m 和 设 定 为 非 0 值 , 即 在 模型 中 加 入 拥挤 和 
资源 限制 项 , 则 均衡 点 会 变 成 既是 稳定 点 又 是 引力 点 。 这 种 情形 如 图 3. 4 中 的 相 
位 图 所 示 。 在 这 个 图 中 ,轨迹 起 始 于 图 的 右 下 角 , 沿 着 一 条 曲线 渐渐 靠近 均衡 点 。 
在 相位 空间 内 , 受 稳 定 均衡 点 的 引力 影响 的 区 域 称 为 引力 点 的 “ 场 域 "。 在 这 张 
图 中 ,所 有 能 观测 到 的 相位 区 域 都 在 引力 点 的 场 域 中 。 图 3. 4 中 的 参数 值 设 为 
a=1,6=1,c=3, e=1, m=1.5, n=0.5, 初始 条 件 设 为 X= 1,Y==0.1。 
这 个 系统 的 均衡 值 是 通过 设 定 方程 3. 1 和 方程 3. 2 同时 为 0 时 得 到 的 X* 和 
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Y 的 值 。 此 时 , X* = (eb +an)/(adh+mn) ALY” = (ca—en)/ (be +mn) 为 这 
个 系统 的 均衡 点 。 在 图 3. 4 的 例子 中 , CX", Y*) = (0.4, 0.4). 


向 量 场 域 和 方向 场 域 图 


当 图 3. 3 和 图 3. 4 所 示 的 相位 图 有 助 于 呈现 一 个 或 多 个 轨迹 如 何在 模型 
的 相位 空间 中 形成 时 ,有 人 可 能 会 问 ,轨迹 通过 相位 空间 的 不 同 区 域 时 会 在 
哪里 消失 ? 我 们 可 以 通过 向 量 场 域 图 或 方向 场 域 图 来 回答 这 个 问题 。 这 两 种 
图 是 密切 相关 的 。 要 建立 一 个 二 维系 统 的 向 量 场 域 图 ,我 们 必须 在 感 兴趣 的 
区 域内 画 一 些 网 格 点 。 根 据 理论 ,你 会 得 到 与 网 格 内 的 每 个 点 相交 叉 的 直线 
和 斜率 (CdX/dY) 。 这 个 斜率 和 前 面 讨 论 的 猎 食 模型 (方程 3. 4) 中 的 斜率 相同 。 

然后 ,以 每 个 网 格 点 作为 起 点 , 沿 着 斜率 的 方向 画 一 条 直线 (常常 画 带 箭头 的 
直线 )。 直 线 的 长 度 取 决 于 系统 方程 在 相位 空间 内 所 选 点 的 值 , 向 量 的 大 小 
H V(dX/dt, dY/dt). 

一 个 向 量 场 域 时 ,每 个 向 量 有 两 个 组 成 部 分 , 即 dX/dt 和 dY/dt。 每 个 
网 格 点 的 导数 就 是 用 来 画 向 量 从 网 格 点 到 终点 的 值 ( 即 向 量 的 大 小 )。 为 了 得 
到 每 个 向 量 的 终点 ,你 得 执行 以 下 步骤 :(1) 把 选 好 要 画 向 量 图 的 每 个 网 格 点 的 
X WY HRA dX/dt 和 dyY/dz 中 ;(2) 计 算 dX/dt 和 dY/dt 的 值 ;(3) 把 这 些 值 
加 到 每 个 网 格 点 的 X 和 Y 点 上 。 网 格 点 是 向 量 的 起 始 值 ,向 量 的 终点 是 起 始点 
加 上 刚才 计算 得 到 的 替换 值 。 然 后 ,在 向 量 场 域内 把 起 点 和 终点 连 起 来 就 得 到 
了 向 量 。 向 量 的 方向 可 以 通过 在 每 条 线 的 终点 画 个 箭头 或 在 每 条 线 的 起 点 画 
个 大 点 ( 星 号 ) 来 标识 。 

图 3. 5 呈现 了 存在 增长 和 拥挤 限制 的 猎 食 模型 的 向 量 场 域 图 的 例子 。 当 用 
SAS 画图 3. 5 时 ,所 有 这 些 都 由 程序 自动 画 好 。Phaser 也 是 一 个 画 这 类 图 的 非 
常 有 用 的 程序 (www. phaser. com), Phaser 是 我 常用 于 建 模 课 的 程序 , 它 能 生 
成 相位 图 .向量 场 域 图 ,方向 场 域 图 及 其 他 许多 图 形 分 析 工 具 。 而 且 , 它 能 实时 
生成 这 些 图 ,可 以 通过 数字 投影 仪 放 到 屏幕 上 ,以 便 学 生 能 看 到 作 图 过 程 
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猫 食 动物 群体 








图 3.5 受 资源 限制 的 猫 食 模型 向 量 图 


画 向 量 图 时 ,常常 有 必要 按 一 定 比例 改变 向 量 的 长 度 , 以 防 这 些 向 量 太 长 。 
在 图 3. 5 中 ,我 没有 使 用 一 个 小 于 1 的 比例 系数 (常常 用 0. 45) 来 乘 以 每 个 向 
量 。 由 于 图 3. 5 的 向 量 没有 乘 以 一 个 比例 系数 ,所 以 有 些 向 量 非常 大 ,以 至 于 在 
图 中 没 法 画 出 来 。 这 就 是 为 什么 这 个 图 的 右上 角 是 空白 的 。 所 有 这 些 向 量 都 
超出 了 这 个 图 框 。 为 了 避免 使 图 看 起 来 太 乱 ,图 3. 5 也 没有 在 线 的 末端 标 箭头 ， 
而 是 在 起 点 用 点 来 表示 方向 。 在 这 个 例子 中 ,由 于 能 看 见 网 格 点 (用 星 号 表 
示 ), 所 以 不 需要 用 箭头 来 表示 向 量 的 方向 ,向 量 从 网 格 点 出 发 延伸 出 去 。 然 
而 ,即使 没有 箭头 ,这 个 图 看 起 来 还 是 有 些 乱 。 向 量 图 最 大 的 用 处 在 于 , 它 能 让 
你 通过 看 向 量 空间 中 的 向 量 长 度 来 了 解 轨迹 在 向 量 中 移动 的 快慢 ,但 要 得 到 这 
个 信息 需 付 出 较 高 的 代价 。 向 量 一 般 会 相互 交叉 ,所 以 常常 很 难 把 它们 分 辨 
开 。 基 于 这 个 原因 ,我 们 常常 使 用 方向 场 域 图 ,而 不 是 向 量 场 域 图 。 请 注意 ,在 
图 3. 5 中 有 一 块 存在 小 点 的 区 域 ,这 就 是 下 面 要 讲 的 “均衡 区 ”。 

方向 场 域 图 通过 把 所 有 的 向 量 都 设 定 为 相同 长 度 (一 般 长 度 较 短 ) 来 解决 
向 量 相互 交叉 的 问题 。 虽 然 现 在 不 能 看 出 轨迹 移动 的 速度 ,但 能 看 出 轨迹 通过 
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相位 空间 的 每 个 点 时 移动 的 方向 。 由 于 方向 场 域 图 更 容易 看 懂 , 所 以 方向 场 域 
图 比 向 量 场 域 图 更 常用 。 图 3. 6 是 一 个 方向 场 域 图 的 例子 ,这 张 图 的 方向 标识 
比 图 3. 5 的 更 短 , 其 大 小 通过 把 X 和 Y 的 导数 同时 乘 以 一 个 比例 系数 得 到 。 这 
个 比例 系数 是 : 





(dX /dt)* + (dY/dt)* 
length 





其 中 ,“length? 是 在 方向 场 域 图 中 呈现 的 向 量 长 度 。 
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图 3.6， 受 资源 限制 的 猎 食 模型 的 方向 场 域 图 


希望 读者 在 画 向 量 场 域 图 时 也 用 Phaser 构建 一 个 方向 场 域 图 ,特别 是 用 来 
解释 某 些 问 题 时 。Phaser 可 以 自动 完成 所 有 的 作 图 工作 。 然 而 , 当 你 遇 到 一 些 
情形 ,需要 自己 编程 画 方向 场 域 图 时 ,Phaser 也 能 帮 你 了 解 整个 过 程 。 实 际 上 ， 
我 常常 遇 到 任何 已 有 的 画图 软件 包 都 不 能 解决 的 特殊 图 形 。 例 如 ,图 3. 7 呈现 
出 两 个 与 之 前 图 形 不 同 的 特点 。 这 个 向 量 场 域 图 的 模型 描述 了 1964 年 在 美国 ， 
ZRA Johnson) 以 压倒 性 优势 战胜 戈 德 华 特 (Goldwater) 赢得 选举 的 过 程 
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(Brown, 1995a:73, 1993). B 3. 7 表示 南方 州 之 外 的 区 域 。 由 于 民主 党 和 共 
和 党 的 选票 比例 加 起 来 不 能 大 于 1, 所 以 ,我 必须 确保 删除 图 形 右上 角 的 所 有 方 
向 标识 ,但 没有 任何 软件 有 这 个 功能 。 
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图 3.7 1964 年 美国 非 南方 区 域 民主 党 和 共和 党 的 党 派 竞争 模型 的 向 量 场 域 图 

请 注意 ,图 3.7 的 方向 标识 与 传统 的 向 量 场 域 图 或 方向 场 域 图 不 同 。 我 
欢 使 用 RK4 法 的 六 次 循环 (或 更 少 循环 ) 来 画 方向 场 域 图 ,而 不 是 直接 用 导数 得 
到 向 量 的 大 小 。 用 RK4 法 得 到 的 方向 标识 会 呈现 一 定 的 弯曲 ,而 不 是 直 的 ,这 
样 看 起 来 更 有 美感 ,而 且 , 这 个 弯曲 特征 解决 了 传统 向 量 场 域 图 中 向 量 之 间 相 
互 交 叉 的 问题 。 它 允许 方向 标识 有 不 同 的 长 度 , 因 此 保存 了 传统 向 量 场 域 图 中 
轨迹 移动 速度 的 信息 。 虽 然 这 需要 重新 编程 ,但 确实 是 一 个 描绘 向 量 场 域 图 的 
更 好 的 方法 。 读 者 在 使 用 时 ,需要 自己 决定 哪 种 方法 最 适合 自己 的 特定 应 用 。 
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均衡 区 和 流程 图 


现在 ,我 们 开始 讨论 图 3.5、 图 3.6 和 图 3. 7 中 出 现 的 点 的 图 形 。 每 个 点 的 
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区 域 是 一 个 “均衡 区 ”。 在 微分 方程 的 传统 研究 中 ,一 般 很 少 遇 到 均衡 区 ,但 它 
们 在 一 般 微 分 方程 的 社会 科学 应 用 中 经 常用 到 。 在 物理 学 和 自然 科学 中 也 常 
常 遇 到 这 种 应 用 ,此 时 主要 集中 在 均衡 点 及 均衡 点 附近 的 轨迹 动向 ,这 是 因为 ， 
这 些 系 统 能 够 运行 足够 长 (并 以 足够 高 的 频率 ) ,以 便 这 些 系 统 有 机 会 在 均衡 点 
或 其 附近 稳定 下 来 。 然 而 ,社会 系统 的 移动 速度 远 远 慢 于 电子 谐振 子 。 在 发 现 
任何 均衡 点 或 其 附近 的 行为 之 前 ,社会 科学 家 常常 研究 系统 的 产生 ,增长 和 消失 。 

让 我 们 用 一 个 实例 来 说 明 这 个 问题 ,如 研究 一 个 选举 竞争 。 这 个 选举 从 开 
始 到 结束 持续 几 个 月 。 我 们 并 不 能 像 物 理学 家 观察 钟 摆 来 回 摆动 上 千 次 那样 
观察 整个 选举 过 程 。 实 际 上 ,社会 系统 可 能 在 轨迹 达到 均衡 点 附近 前 就 结束 
了 。 例 如 ,选举 开始 后 ,每 天 根据 投票 数 观 察 选民 的 选择 偏好 。 在 很 多 选举 中 ， 
我 们 常常 能 看 到 ,根据 投票 数 随时 间 的 变化 推测 ,如 果 选 举 再 延长 几 周 或 几 天 ， 
另 一 个 候选 人 或 党 派 就 可 能 赢得 选举 。 有 时 候 一 个 社会 系统 能 达到 均衡 ,但 有 
时 社会 系统 还 没有 达到 均衡 时 ,就 会 遇 到 一 个 社会 或 政治 事件 打 断 或 终止 其 动 
态 过 程 的 情形 。 在 这 些 情 形 中 常常 发 生 的 情况 是 , 当 轨 迹 接 近 均 衡 点 时 ,速度 
会 变 慢 。 因 此 ,在 许多 社会 科学 情形 中 ,我 们 不 仅 需 要 知道 均衡 点 的 位 置 ,而 且 
也 要 知道 相位 空间 中 ,轨迹 变化 变 慢 的 区 域 ,这 些 区 域 就 是 均衡 区 。 这 对 于 社 
会 科学 家 非常 重要 ,因为 相位 空间 的 轨迹 很 有 可 能 就 在 这 些 均 衡 区 内 结束 ,而 
不 是 在 均衡 点 处 。 均 衡 点 一 般 位 于 均衡 区 ,但 社会 现象 的 发 生 轨 迹 可 能 在 达到 
均衡 前 或 在 靠近 均衡 点 的 均衡 区 “ 卡 住 ”或 终止 。 

我 们 可 以 通过 求 系统 ( 即 微分 方程 ) 的 导数 大 小 (如 绝对 值 ) 得 到 均衡 区 。 
例如 ,在 一 个 二 维系 统 里 , 当 两 个 导数 dX/dt 和 dY/di 的 大 小 低 于 某 个 特定 灵 
敏 水 平时 ,相位 空间 的 那个 区 域 就 被 确定 为 均衡 区 。 在 这 些 区 域内 ,两 个 变量 
的 变化 如 此 微小 ,以 至 于 社会 系统 很 可 能 在 继续 发 展 之 前 就 终止 或 被 中 断 。 灵 
敏 水 平 是 随意 设 定 的 ,需要 根据 具体 系统 逐个 调整 ,大 部 分 取决 于 系统 在 终止 
或 中 断 之 前 还 能 发 展 多 久 。 然 而 ,一 般 常用 的 起 始 值 在 0. 1 和 0. 01 之 间 。 

还 有 类 似 于 图 3. 7 所 示 的 另 一 类 图 形 , 它 能 以 更 真实 的 方式 呈现 模型 的 轨 
迹 如 何 根据 数据 发 生变 化 。 由 于 社会 科学 研究 的 轨迹 可 能 无 法 达到 均衡 点 ,所 
以 一 般 会 关注 它们 真正 有 多 少 进展 。 一 个 轨迹 的 实际 长 度 可 以 根据 步 长 和 用 
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RK4 法 的 循环 次 数 来 决定 。 当 用 数据 来 估计 模型 参数 时 ,可 以 解决 这 些 问 题 ， 
具体 做 法 可 参见 布朗 (1995a) 。 一 旦 得 到 微分 方程 模型 的 参数 , 画 一 个 表示 许多 
轨迹 在 相位 空间 的 路 径 的 “流程 图 ”将 非常 有 用 。 每 条 轨迹 给 定 一 个 真实 的 初 
始 条 件 , 并 只 有 当 程序 允许 时 才能 移动 ,这 些 程序 用 来 估计 参数 值 。 图 形 的 初 
始 条 件 是 可 以 随机 选择 的 ,只 要 这 些 值 来 自 研 究 的 真实 数据 。 图 3. 8 表示 了 一 
个 这 样 的 流程 图 (Brown,，1995a:75) ,该 流程 图 使 用 了 与 图 3. 7 一 样 的 模型 和 参 
数值 。 读 者 应 该 注意 到 ,虽然 我 用 SAS 来 编程 并 画图 3. 8, 但 程序 Phaser 也 用 
点 或 点 击 来 画 流程 图 。 

另外 ,特别 值得 注意 的 是 ,我 们 可 以 不 限制 轨迹 的 长 度 来 画 流 程 图 ,还 可 以 
让 轨迹 直达 均衡 点 附近 的 领域 ,实际 上 ,这 是 画 流程 图 的 非常 适用 的 方法 。 流 
程 图 也 可 以 用 来 表示 数据 在 一 个 系统 中 是 怎么 运行 的 。 当 一 个 系统 被 某 事 件 
打 断 时 ,如 选举 日 程 . 革 命 、 暗 杀 或 其 他 事件 ,在 相位 图 中 画 出 截断 的 轨迹 就 有 
助 于 描述 这 个 系统 对 数据 的 影响 程度 。 


本 章 小 结 


本 章 介绍 了 微分 方程 系统 。 大 部 分 研究 人 员 想 研究 的 是 系统 ,而 不 是 单个 方 
程 模型 ,因为 这 是 利用 微分 方程 建 模 的 真正 优势 所 在 。 本 章 的 重点 在 于 使 用 画图 
技术 来 分 析 微 分 方程 系统 。 主 要 的 画图 技术 是 相位 图 ,这 是 没有 时 间 轴 的 序列 变 
量 的 图 。 大 部 分 相位 图 把 系统 均衡 值 放 在 图 中 ,然后 再 画 一 些 穿 过 相位 空间 的 轨 
迹 作 为 例子 。 然 后 ,本 章 介绍 了 来 自 群体 生物 学 的 一 个 经 典 实例 , 即 猎 食 模型 ,这 
个 模型 的 要 素 在 很 多 领域 (包括 社会 科学 领域 ) 的 系统 中 都 能 找到 。 本 章 也 介绍 
了 一 些 其 他 分 析 微分 方程 系统 的 画图 技术 ,如 向 量 场 域 图 和 方向 场 域 图 。 在 一 般 
情况 下 ,方向 场 域 图 更 受 欢迎 ,因为 它 看 起 来 更 简洁 。 当 社会 系统 变化 过 程 很 慢 
的 时 候 ,微分 方程 系统 常常 没有 机 会 到 达 系统 轨迹 应 该 达到 的 均衡 点 。 实 际 上 ， 
当 轨迹 经 过 均衡 点 附近 的 地 方 时 ,它们 就 会 停顿 ?下 来 ,而 均衡 点 的 附近 区 域 称 为 
“均衡 区 ”。 在 相位 图 中 画 出 均衡 区 是 一 种 非常 有 用 的 识别 方法 , 它 可 用 来 识别 轨 
迹 还 没有 达到 均衡 ,但 由 于 前 行 速度 太 慢 ,以 至 于 系统 最 终 终 止 的 情形 。 
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现在 ,介绍 一 些 经 典 的 微分 方程 系统 将 非常 有 用 ,这 些微 分 方程 系统 对 社 
会 科学 起 了 非常 重要 的 影响 。 读 者 会 发 现 , 这 些 系统 的 许多 方面 都 与 之 前 描述 
的 狂 食 模型 很 相似 。 下 面 的 讨论 将 介绍 分 析 这 些 系统 的 一 些 附加 方法 。 

更 具体 地 说 ,本 章 将 介绍 3 个 非常 经 典 的 模型 ,它们 对 推广 微分 方程 在 社会 
科学 中 的 发 展 和 应 用 起 到 了 非常 重要 的 影响 。 这 3 个 模型 是 : 理 查 森 (1960) 的 
军备 竞赛 模型 、 兰 彻 斯 特 (Lanchester，1916) 战 斗 模 型 的 3 个 方案 、 拉 波 波 特 
(1960) 的 生产 交易 模型 。 研 究 这 些 模型 能 帮助 我 们 更 全 面 深 入 地 理解 这 些 模 
型 所 描述 的 潜在 过 程 。 我 们 也 能 通过 这 些 模型 模拟 来 检验 “如 果 …… 会 怎样 ?” 
的 想法 ,这 些 想 法 能 告诉 我 们 更 多 系统 的 动态 过 程 。 这 些 探索 能 增加 我 们 关于 
这 些 过 程 的 预测 性 理解 。 如 果 我 们 模拟 一 些 真 实生 活 中 不 希望 发 生 的 事情 ,如 
失控 的 军备 竞赛 或 灾难 性 的 全 球 变 暖 ,就 能 从 模型 中 推断 出 一 些 关键 问题 ,从 
而 帮助 我 们 学 会 如 何 更 有 效 地 管理 我 们 的 世界 。 实 际 上 ,直到 今天 ,很 多 军人 
在 调派 军队 前 还 是 使 用 兰 彻 斯 特 战斗 模型 来 模拟 不 同 的 战场 情形 。 模 拟 是 建 
模 的 最 大 益处 之 一 。 

微分 方程 模型 的 使 用 并 不 是 万 能 的 。 所 有 的 模型 都 是 真实 情形 的 简化 。 
有 时 候 , 对 于 特定 的 情形 ,简单 最 小 二 乘 回 归 模 型 就 足够 了 。 但 是 ,一 个 动态 过 
程 的 复杂 性 只 有 在 更 准确 地 描述 随时 间 变 化 的 细节 后 才能 揭示 。 在 这 种 情形 
下 ,使 用 微分 方程 能 使 我 们 更 好 地 模拟 实际 随时 间 变 化 的 过 程 ,以 便 这 些 研究 
和 推断 的 应 用 得 到 最 大 化 。 
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理 查 森 军备 竞赛 模型 


路 易 斯 。 弗 菜 。 理 查 森 的 军备 竞赛 模型 毫 无 疑问 是 社会 科学 中 最 有 名 的 
微分 方程 模型 之 一 。 介 绍 理 查 森 的 想法 和 模型 的 文献 非常 多 ,这 里 不 可 能 全 部 
涉及 。 但 是 ,基本 军备 竞赛 模型 本 身 对 军事 竞赛 的 研究 和 整个 社会 来 说 都 是 非 
常 重要 的 。 实 际 上 , 理 查 森 自己 也 相信 他 关于 国家 军事 竞争 方式 的 见解 可 能 对 
防止 第 二 次 世界 大 战 的 爆发 非常 有 用 (Richardson，1960:ix)。 模 型 (两 个 相互 
依赖 的 微分 方程 系统 ) 本 身 非常 简单 。 为 了 获得 许多 有 用 的 结果 ,我 们 有 可 能 
根据 分 析 处 理 模 型 。 但 是 ,我 很 少 这 样 做 ,因为 这 些 处 理 方法 并 不 是 特别 适用 
于 其 他 更 复杂 的 模型 。 然 而 ,我 会 集中 介绍 广泛 适用 于 各 类 常 微分 方程 系统 的 
分 析 方法 。 

理 查 森 军备 竞赛 模型 有 3 个 基本 假设 (Richardson，1960:13 一 16) 。 第 一 个 
假设 是 , 当 一 个 国家 看 到 其 他 国家 在 武器 装备 上 的 投入 增加 时 , 它 也 会 增加 本 
国 的 武器 装备 。 然 而 ,军费 支出 是 社会 的 一 项 经 济 负担 , 较 高 的 军费 支出 将 抑 
制 其 他 支出 的 增长 ,这 是 第 二 个 假设 。 最 后 ,有 很 多 关于 文化 或 国家 领导 人 的 
抱怨 或 野心 ,这些 能 刺激 或 抑制 军费 支出 。 所 有 这 些 可 以 用 下 面 的 方程 来 
表示 : 

dx/dt = ay — mx + g [4.1] 


dy/dt = br — ny +h [4. 2] 


这 里 有 两 个 国家 XX 和 Y。dx/dt 和 dy/dt 分 别 表示 两 个 国家 军费 支出 的 变化 。 
方程 中 的 ay 和 bz 分 别 表示 其 他 国家 军费 支出 对 本 国 军 费 支 出 的 影响 ,zz 和 
ny 表示 本 国 目 前 支出 的 经 济 负担 对 其 抑制 本 国 将 来 的 军费 支出 的 影响 ,常数 项 
g 和 有 分 别 表示 国家 X 和 YY 的 领导 人 的 抱怨 和 野心 。 

这 是 两 个 相互 线性 依赖 的 方程 系统 。 由 于 这 个 系统 是 线性 的 ,所 以 在 数学 
上 很 容易 操作 ,其 中 一 些 操 作 有 利于 重新 解释 参数 的 含义 。 例 如 ,我 们 可 以 说 ， 
方程 4. 1 实际 上 测量 了 两 国 军费 支出 z 和 y 的 差距 (或 不 均衡 程度 )。 请 注意 ， 
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ay 一 mz =aly—mzr/a), 因此 ,参数 a 可 以 解释 为 军费 支出 相对 于 两 国 军费 均衡 
的 比例 。 参 数 ma 是 一 个 帮助 确定 理想 的 均衡 水 平 的 常数 (Danby，1991:48) 。 
如 同 大 部 分 微分 方程 系统 ,我 们 想 确 定 的 第 一 件 事情 是 ,这 个 系统 是 否 存 
在 一 个 均衡 点 (或 多 个 均衡 点 )。 我 们 通过 把 微分 方程 组 (方程 4. 1 和 方程 
4. 2) 设 为 0, 求解 这 个 方程 组 来 得 到 均衡 点 X 和 Y* 。 这 里 ,得 到 两 条 直线 的 
方程 组 为 : 
0 =ay— mr +g [4.3] 


0 = bhr — ny +h [4.4] 


这 两 个 方程 的 均衡 点 就 是 这 两 条 直线 的 交点 。 在 这 里 , X* = (ah + gn)/(mn — 
ab), Y* = (bg +hm)/(mn — ab), RE mn — ab Æ 0, 就 存在 均衡 点 。 

下 一 步 我 们 想 知 道 , 这 个 均衡 点 是 否 稳定 。 也 就 是 说 ,均衡 点 (X , Y* ) 附 
近 的 轨迹 是 流向 均衡 点 并 停留 在 其 附近 ,还 是 远离 均衡 点 ? 这 个 问题 的 答案 取 
决 于 参数 值 。 对 于 任何 特定 的 参数 值 ,确定 均衡 点 是 否 稳定 的 一 种 方式 是 在 一 
张 图 中 画 两 条 线 (方程 4. 3 和 方程 4. 4) ,然后 留意 图 中 不 同 区 域 中 导数 的 符号 ， 
因为 它们 是 由 这 两 条 直线 确定 的 。 这 种 方法 在 理 查 森 (1960: 24—27) 、 丹 比 
(Danby，1997:49 一 50) 和 其 他 很 多 文献 中 均 有 介绍 。 

然而 ,一 阶 微分 方程 的 二 维系 统 的 稳定 性 与 二 阶 微分 方程 的 稳定 性 有 明确 
的 联系 。 弄 清楚 为 什么 这 样 非常 有 帮助 。 本 书 之 后 会 介绍 怎么 把 一 个 二 阶 微 
分 方程 转换 成 两 个 一 阶 微分 方程 系统 。 反 之 亦 然 , 即 能 把 两 个 一 阶 微分 方程 系 
统 改写 成 一 个 二 阶 微分 方程 。 以 理 查 森 军 备 竞赛 模型 为 例 ,对 方程 4. 1 两 边 求 
导 得 到 d?zx/dz ,从 而 得 到 : 


d’x/dt® = a(dy/dt) —m(dz/di) [4.5] 
现在 ,变换 方程 4. 5, 得 到 dy/dt 的 表达 式 , 代 入 方程 4. 2, 得 到 : 
d’x/dt® = albx — ny +h) — m(dx/dt) [4.6] 


再 根据 方程 4. 1 得 到 y 的 表达 式 , 代 人 方程 4. 6, 再 整理 得 到 以 下 二 阶 微分 
方程 : 
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d’ x/dt? + (m+n) (dx /dt) + (mn — ab)x— (ah +ng) 一 0 





一 般 来 讲 , 我 们 没有 必要 把 一 阶 微分 方程 系统 转换 成 二 阶 微分 方程 来 分 
析 , 但 实际 情况 刚好 相反 ,我 们 需要 把 二 阶 微分 方程 转换 成 一 阶 微分 方程 系统 ， 
然后 再 用 本 书 介 绍 的 分 析 方 法 来 分 析 。 我 们 处 理 一 阶 微分 方程 系统 时 ,其 实 就 
是 在 处 理 高 阶 微分 方程 。 前 面 介绍 的 内 容 对 理解 这 一 点 非常 必要 。 二 阶 微分 
方程 比 一 阶 微分 方程 能 “做 更 多 ”, 从 某 种 意义 上 讲 , 二 阶 微分 方程 比 一 阶 微分 
方程 更 能 表现 多 样 的 行为 。 因 此 , 当 我 们 处 理 一 阶 微分 方程 系统 的 时 候 , 我 们 
正 是 利用 微分 方程 的 所 有 行为 "能 量 ”。 

理 查 森 军备 竞赛 模型 能 产生 多 组 行为 模式 。 我 们 可 以 通过 流程 图 来 看 这 
些 模 式 。 图 4. 1 是 一 个 流程 图 和 方向 场 域 图 的 组 合 图 。 在 这 个 例子 中 ,我 们 用 
Phaser 程序 来 画 这 张 图 及 后 面 的 附加 图 。 用 于 这 张 图 的 方程 是 dx /dt = 0. 1y 一 
0.1z 十 0.02 和 dy/d = 0.1z 一 0.1y 十 0.03, 这 些 参数 表示 对 敌国 的 怀疑 (如 
a=0.1,6=0.1) 和 本 国 的 经 济 负担 (如 m = 0.1, n= 0. 1) 水 平 相当 ,但 是 国 
Z Yh = 0. 03) 的 历史 和 领导 因素 比 国家 X(g = 0. 02) 稍 有 加 强 。 图 4. 1 所 展 
示 的 是 个 可 怕 的 情形 ,因为 我 们 看 到 的 将 是 两 国之 间 失 控 的 军备 竞赛 。 








Y 国 的 军备 支出 

















X 国 的 军备 支出 
图 4.1 理 查 森 军 备 竞赛 (第 一 种 情形 ) 
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图 4. 2 呈现 了 一 个 不 同 的 情形 。 图 中 用 到 的 方程 是 dr /di = y 一 2z 十 3 和 
dy/dt = 4z 一 5y 十 6。 在 这 个 例子 中 ,我 使 用 的 是 丹 比 (1997:51) 所 使 用 的 参数 
值 。 我 们 可 以 清楚 地 看 到 ,图 的 中 心 点 附近 有 一 个 稳定 的 均衡 点 ,因为 所 有 的 
轨迹 都 趋向 这 个 点 。 表 达 这 种 情形 的 另 一 种 方式 是 ,所 有 轨迹 都 落 到 这 个 引力 
点 的 场 域 中 。 这 是 一 个 能 找到 军力 均衡 的 军备 竞赛 。 
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图 4.2 理 查 森 军备 竞赛 (第 二 种 情形 ) 


然而 ,即使 稍稍 改变 参数 ,也 能 产生 非常 不 同 的 结果 ,如 图 4. 3 所 示 。 图 4. 
3 所 使 用 的 方程 是 dr /dt = 2y 一 + 一 1 和 dy/dt = 5x—4y—1, 在 这 种 情形 中 ， 
图 左下 角 的 均衡 点 不 稳定 ,意味 着 这 是 一 个 排斥 极 。 轨 迹 最 终 将 远离 这 个 点 ， 
或 者 安全 地 回归 到 原点 ,或 者 无 休止 地 趋向 毁灭 性 的 增长 。 以 哪 种 方式 终止 取 
决 于 它们 的 起 点 ,这 种 情形 也 并 不 能 令 人 欣慰 。 在 这 里 显示 的 3 种 情形 中 , 仅 有 
图 4.2 表示 的 第 二 种 情形 才能 真正 令 人 欣慰 。 但 需要 注意 的 是 ,从 第 一 种 情形 
的 相对 稳定 到 第 三 种 情形 (图 4. 3) 的 排斥 极 的 不 稳定 性 , 仅 需要 改动 模型 中 有 
关 领 导 因 素 的 参数 值 (参数 六 和 8 ) 即 可 。 这 就 是 让 理 查 森 非常 担忧 的 问题 。 

读者 可 以 继续 深入 探究 理 查 森 军备 竞赛 模型 (其 实 已 经 有 很 多 介绍 )。 如 
果 读 者 刚 开 始 接触 该 模型 ,可 以 参考 拉 波 波 特 (1960) 布朗 (1983)、 丹 比 (1997) 
和 赫 克 费 尔 特 、 科 费 尔 德 . 莱 肯 斯 (1982) 著 作 中 关于 这 个 模型 的 讨论 。 但 是 ,前 
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X 国 的 军备 支出 
图 4.3 理 查 森 军备 竞赛 (第 三 种 情形 ) 


面 的 基本 思想 概述 展示 了 ,社会 科学 家 如 何 用 简单 的 微分 方程 模型 从 人 类 社会 
中 提取 深刻 的 道理 。 


兰 彻 斯 特 战斗 模型 


1996 年 ,F. W. 兰 彻 斯 特 发 表 了 一 系列 用 微分 方程 模型 定量 描述 不 同类 型 
的 军队 在 战场 上 交战 时 ,军队 之 间 的 得 失 。 这 些 模型 最 终 都 成 为 经 典 的 模型 ， 
在 很 多 一 般 建 模 课程 或 分 析 军 事 战争 行动 的 课程 中 被 仔细 研究 。 读 者 可 以 在 
布朗 (1983) 和 丹 比 (1997:;139 一 140) 的 论文 中 看 到 这 些 模型 的 有 趣 应 用 ,还 能 
布衣 (1983) 和 恩格尔 (Engel，1954) 的 著作 中 找到 把 这 些 模 型 应 用 于 第 二 次 世 
界 大 战 中 的 硫磺 岛 (Iwo Jima) 战 役 的 经 典 讨论 。 

兰 彻 斯 特 战斗 模型 常常 考虑 3 种 情形 。 这 3 种 模型 的 不 同 主要 在 于 参与 战 
争 的 是 常规 军 还 是 游击 队员 。 两 个 军队 的 军事 力量 分 别 用 变量 x 和 y 来 表示 。 
对 于 双方 军队 来 说 ,都 有 两 种 损耗 率 和 一 种 增援 来 源 ( 来 自 援军 )。 第 一 种 损耗 
率 是 军事 行动 方面 的 。 军 事 行动 的 损耗 仅仅 发 生 在 部 署 自己 军队 的 时 候 。 这 
种 损耗 包括 由 于 交通 事故 .意外 的 坠 机、 疾病 和 逃跑 造成 的 死亡 。 一 个 军队 的 
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军事 行动 损耗 率 与 这 个 军队 部 署 的 士兵 数量 成 比例 。 这 类 损耗 在 兰 彻 斯 特 战 
斗 模 型 的 3 种 情形 中 都 是 类 似 的 。 第 二 种 损耗 率 是 战斗 损耗 。 战 斗 损耗 是 由 政 
军 的 杀伤 行动 造成 的 死亡 。 当 一 个 军队 由 常规 军 组 成 , 且 假 定常 规 军 处 于 敌 军 
的 杀伤 范围 内 , 则 敌 军 可 以 直接 观察 到 其 兵力 。 常 规 军 的 战斗 损耗 与 敌 军 的 兵 
力 成 比例 。 例 如 ,如 果 部 队 X 是 常规 军 ,那么 它 的 战斗 损耗 率 是 xy, 其 中 ,> 是 
敌 军 的 数量 ,参数 a 是 比例 系数 。 这 个 参数 称 为 部 队 Y 的 “作战 能 力 系数 ”。 这 
个 参数 值 越 大 ,部 队 Y 杀 死 部 队 X 士兵 的 能 力 越 强 。 

游击 部 队 的 战斗 损耗 与 常规 军 不 同 。 游 击 队员 一 般 都 藏 在 城市 或 自然 环 
境 中 , 敌 军 很 难 发 现 他 们 。 要 杀 死 游击 队员 ,一 般 需要 敌 军 直 接 一 对 一 或 以 小 
部 队 形 式 与 游击 队员 作战 。 因 此 ,需要 与 游击 队 作 个 人 接触 。 从 数学 上 来 说 ， 
这 种 交互 作用 常常 通过 把 两 个 变量 x 和 y 相 乘 得 到 。 在 这 种 情况 下 ,如 果 部 队 
X 是 游击 队 , 那 么 ,其 战斗 损耗 率 是 cry, 其 中 ,c 表示 部 队 Y 杀 死 游击 队 X 的 队 
员 的 作战 能 力 系 数 。 

部 队 能 增加 兵力 的 唯一 方式 是 增 派 援军 。 这 种 增援 随 战 场 的 变化 而 变化 。 
需要 注意 的 是 , 兰 彻 斯 特 战斗 模型 中 的 大 部 分 短期 行动 是 由 杀伤 或 军事 行动 造 
成 的 死亡 而 形成 。 因 此 ,援军 成 为 任何 持续 时 间 很 长 的 战场 的 一 个 至 关 重 要 的 
附加 因素 。 


情形 一 
在 兰 彻 斯 特 战斗 模型 的 第 一 种 情形 中 ,两 支 正规 军队 作战 。 这 种 作战 情形 
可 以 用 方程 4. 7 和 方程 4. 8 来 表示 。 
dr/dt =— ay — ex + f(t) [4. 7] 
dy/dt =— br — ny + g(t) [4.8] 


在 方程 4. 7 和 方程 4. 8 中 ,参数 a 是 部 队 Y 杀伤 部 队 X 的 作战 能 力 系数 ， 
参数 2 是 部 队 X 杀伤 部 队 Y 的 作战 能 力 系数 。 部 队 X 的 军事 行动 损耗 率 由 ex 
决定 ,部 队 Y 的 军事 行动 损耗 率 由 ny 决定 。 当 然 ,所 有 损耗 率 的 系数 都 是 负 
A. PR (CO Al go 分 别 是 部 队 X 和 部 队 Y 的 援军 比率 。 
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第 一 种 情形 产生 了 一 个 由 两 个 一 阶 相互 依赖 的 常 微分 方程 组 成 的 线性 系 
统 。 这 种 系统 的 行为 特点 因 参 数值 的 不 同 而 存在 很 大 差异 。 这 些 方程 的 分 析 
方法 之 一 是 直接 通过 算术 变换 。 例 如 ,读者 会 问 ,是 否 存在 一 种 分 析 方 法 ,能 从 
模型 的 算式 中 识别 出 一 个 部 队 如 何 比 另 一 个 部 队 更 有 优势 ,实际 上 确实 存在 这 
种 情形 。 如 果 没 有 援军 ,而 且 没有 军事 行动 损耗 率 ,那么 我 们 可 以 把 方程 4 7 除 
以 方程 4 8 得 到 dx /dy = ay/tx。 我 们 使 用 分 离 变 量 法 来 对 这 个 方程 积分 ， 
得 到 : 

bc? =ay?+C 
其 中 ,C 是 积分 常数 。 把 这 个 方程 重新 整理 ,得 到 bhr 一 ay? = C, 这 适应 于 微分 
方程 系统 的 任意 解 。 这 表明 ,只 要 hr? > ayi, 部 队 X 就 会 赢得 战争 。 在 这 里 ， 
zo 和 yo 是 这 些 变量 的 初始 值 。 这 是 兰 彻 斯 特 “二 乘法 ”应 用 于 正规 部 队 之 间 的 
战争 时 的 例子 。 


情形 二 


兰 彻 斯 特 战斗 模型 的 第 二 种 情形 是 一 支 正规 部 队 和 一 支 游击 部 队 之 间 的 
战争 。 只 有 在 描述 游击 队 的 损耗 时 , 才 需 要 交互 战争 损耗 项 。 这 种 情形 可 以 用 
方程 4. 9 和 方程 4. 10 表示 : 


de/d =— cry — ex + f(t) [4.9] 
dy/dt =— bt —ny + g(t) [4.10] 
请 注意 ,这 种 情形 和 情形 一 之 间 仅 有 的 差异 是 用 czy 来 代替 部 队 X 的 战争 
损耗 率 。 这 一 项 使 得 这 两 个 微分 方程 组 成 的 系统 变 成 非 线 性 。 
情形 三 
兰 彻 斯 特 战斗 模型 的 第 三 种 情形 是 两 支 游击 部 队 之 间 的 战争 。 这 种 情形 
可 以 用 方程 4. 11 和 方程 4. 12 表示 。 


dx/dt =—cxy — ex + f(t) [4.11] 
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dy/dt =— kry —ny + g(t) [4.12] 


在 这 种 情形 下 ,两 支部 队 都 有 交互 战争 损耗 率 。 


拉 波 波 特 生产 交易 模型 


下 面 的 模型 由 阿 纳 托 尔 * 拉 波 波 特 (1960) 提 出 ,后 由 丹 比 (1997:140 一 141) 
修改 。 这 是 本 书 中 所 包含 的 微分 方程 应 用 的 非常 有 用 的 例子 之 一 ,因此 , 它 展 
示 了 这 样 的 方程 如 何 应 用 到 经 济 学 和 社会 选择 理论 中 。 虽 然 模型 的 分 析 揭示 
了 个 人 行为 中 令 人 惊讶 的 复杂 一 面 ,但 模型 的 基本 理念 非常 简单 。 

我 们 从 两 个 人 XX 和 Y 开始 介绍 。 两 个 人 都 生产 物品 ,分 别 表示 为 x 和 y。 
为 了 增加 他 们 的 幸福 感 ,他 们 希望 相互 交换 各 自 的 产品 。 一 个 人 把 自己 产品 的 
一 定 比 例 p 留 下 , 男 一 部 分 g 拿 去 交易 ,其 中 , q= 1 一 p。 一 个 人 拥有 和 交易 产 
品 的 幸福 感 通常 根据 “效应 ”来 测量 ,效应 普遍 用 于 经 济 学 和 社会 选择 讨论 中 ， 
它 能 够 作为 “公共 分 母 ”" 用 于 不 同事 物 间 的 比较 。 例 如 ,假定 立 生 产 的 物品 和 Y 
生产 的 不 同 。 因 此 ,我 们 自然 会 问 , 根 据 一 个 人 的 满意 度 或 幸福 度 , 一 个 单位 的 
y 将 值 多 少 单位 的 +。 如 果 已 知 某 个 人 从 一 个 单位 的 z 获得 的 效应 以 及 从 一 个 
单位 的 y 获得 的 效应 ,那么 ,我 们 可 以 简单 地 把 这 些 效 应 相 加 ,得 到 同时 拥有 x 
和 y 的 效应 。 我 们 想 通 过 模型 来 表示 x A y EE X A Y 生产 的 产品 数量 
的 变化 ) 产 生 的 效应 如 何 随 着 x 和 y 的 大 小 变化 而 改变 。 

建立 这 个 模型 需要 根据 生产 交易 的 得 失 来 表示 生产 者 X 和 YY 的 效应 。 拉 
波 波 特 假 设 ,人 一 般 不 想 工作 ,除非 不 得 不 工作 时 才 会 去 工作 。 因 此 , 由 于 不 得 
不 生产 ,所 以 生产 的 效应 会 减少 。 由 于 不 得 不 生产 导致 的 效应 减少 的 大 小 是 产 
品 数量 的 函数 ,但 是 效应 的 增加 却 不 一 样 。 人 们 喜欢 拥有 产品 ,因此 , 当 人 们 获 
得 自己 或 别人 生产 的 物品 时 ,效应 会 增加 。 这 里 ,我 们 引入 一 个 精神 物理 学 中 
常用 的 概念 , 即 费 希 纳 法 则 (Fechner” Law) ,有 时 也 称 为 “韦伯 法 则 ”(Weber’s 
Law)。 这 个 法 则 指出 ,只 有 当 个 人 受到 的 原始 刺激 成 几何 级 数 增长 时 ,个 人 的 
意识 才能 成 算术 级 数 增长 。 根 据 这 个 法 则 ,拥有 的 物品 加 倍 ,会 使 一 个 最 初 连 
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一 分 钱 都 没有 的 穷人 的 满足 感 大 大 增加 ,而 一 个 富 人 从 中 得 到 的 满足 感 远 没 有 
穷人 多 。 费 希 纳 法 则 的 原始 概念 是 有 关 受 到 光电 等 物理 刺激 的 增加 与 感觉 意 
识 的 增加 之 间 的 关系 。 
因此 ,我 们 能 够 把 每 个 人 的 效应 模型 化 为 : 
U, = log(1+ pr +qy)—r,x 


U, = logg +qr + py) —ryy 


在 这 里 ,U; 表示 第 i 个 人 由 于 物品 得 失 而 获得 的 效应 ,一 rx 和 一 my 分 别 
表示 由 于 必须 工作 而 减少 的 效应 , log(1 十 qr 十 py) A logd + pr +qy) 表示 由 
于 拥有 物品 而 获得 的 效应 。 因 为 个 人 X AY 因 人 迫 于 生计 不 得 不 工作 而 减少 的 
效应 不 同 , 所 以 我 给 他 们 的 效应 减少 项 附 上 了 不 同 的 下 标 。log 项 中 的 1 是 为 
了 避免 + 和 y 太 小 时 ,效应 值 为 负 值 而 添加 的 。 

但 是 ,我 们 想 要 模型 化 的 是 x Al 值 的 变化 ,而 不 是 个 人 XX A Y 的 效应 。 
从 这 个 建 模 概 念 内 涵 的 理性 视角 来 看 ,模型 假设 产量 的 变化 仅 当 效应 发 生变 化 
时 才 改 变 。 具 体 模 型 化 的 一 种 方法 是 把 x+ 和 yy 的 变化 表示 成 他 们 各 自 效 应 函 
数 的 偏 导 数 的 比例 。 因 此 ,我 们 可 以 规定 : 


dx 








de e p . 
M ET ETT [s13] 
dy p 

d = olateeFp ™) [A] 


对 这 个 模型 的 分 析 始 于 确定 模型 的 均衡 值 ,而 对 这 个 模型 的 数值 分 析 
始 于 设 定 不 同 的 参数 值 。 有 时 ,我 们 可 以 把 参数 值 设 定 为 o = cy Mr = 
六 。 给 定 不 同 的 参数 值 可 以 画 出 这 个 模型 的 不 同 特征 的 相位 图 。 例 如 , 当 X 
或 Y( 但 不 是 两 者 都 ) 停 止 生产 时 ,产生 寄生 状态 一 一 工作 的 行为 准则 (如 参 
数 rx, 和 x7,) 稍 稍 发 生变 化 将 导致 严重 的 长 期 整体 交易 失衡 ,从 而 产生 寄生 
状态 。 这 个 模型 不 仅 能 描述 个 人 之 间 的 相互 影响 ,而 且 能 扩展 到 描述 国家 
之 间 的 相互 影响 。 
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本 章 小 结 


本 章 介 绍 了 社会 科学 中 使 用 微分 方程 建 模 的 3 个 经 典 实例 。 这 3 个 例子 都 
包括 一 阶 微分 方程 系统 。 前 两 个 模型 ( 理 查 森 军备 竞赛 模型 和 兰 彻 斯 特 战斗 模 
型 ) 重 点 讨论 军事 概念 ,这 是 在 所 有 用 微分 方程 建 模 的 文献 中 有 关 社 会 科学 的 、 
引用 最 广 的 模型 之 一 。 两 个 模型 都 具有 之 前 讨论 的 猎 食 模型 中 的 算术 成 分 。 
本 章 最 后 介绍 的 社会 科学 模型 是 拉 波 波 特 生 产 交易 模型 ,这 是 个 有 关 经 济 学 主 
题 的 模型 。 这 个 例子 的 算术 结构 更 复杂 , 它 展示 了 微分 方程 模型 如 何 用 来 处 理 
消费 者 偏好 和 个 人 效应 这 类 问题 。 这 些 例子 尽管 很 引人入胜 ,但 是 仅仅 触及 微 
分 方程 建 模 在 社会 科学 中 广泛 应 用 的 一 角 。 在 社会 科学 研究 中 ,出 现 了 越 来 越 
多 更 高 级 的 模型 ,它们 能 以 新 方式 冲破 模型 具体 化 的 边界 。 


第 5 章 | 二 阶 非 自治 微分 方程 转化 成 一 阶 
微分 方程 系统 


本 书 到 目前 为 止 ,仅仅 讨论 了 一 阶 微分 方程 系统 。 然 而 ,理论 家 有 时 需要 
处 理 包含 更 高 阶 导 数 的 模型 ,如 二 阶 导 数 的 模型 。 实 际 上 ,我 们 已 经 间接 处 理 
过 二 阶 导 数 ,因为 一 阶 微分 方程 系统 能 表示 成 二 阶 微分 方程 ,这 在 前 面 介绍 理 
查 森 军备 竞赛 模型 时 讨论 过 。 一 般 来 讲 ,我 们 不 需要 担心 把 一 阶 微分 方程 系统 
转换 成 一 个 二 阶 微 分 方程 的 问题 ,因为 本 书 所 介绍 的 都 是 处 理 一 阶 微 分 方程 的 
技术 。 然 而 , 当 我 们 从 二 阶 微分 方程 开始 , 且 需 要 把 这 个 方程 转换 成 一 阶 微分 
方程 系统 来 用 这 些 技术 做 分 析 时 ,就 会 出 现 问题 。 

在 物理 科学 中 ,经 常 遇 到 二 阶 微分 方程 模型 。 此 外 ,有 关 物 体质 量 和 加 速 
度 的 牛顿 第 二 法 则 是 一 个 二 阶 微分 方程 ,因为 加 速度 是 速度 的 导数 ,而 速度 本 
身 是 一 阶 导数 。 但 在 社会 科学 中 ,大 部 分 微分 方程 模型 始 于 一 阶 微 分 方程 系 
统 。 如 果 社 会 科学 家 从 一 开始 就 是 处 理 一 阶 微分 系统 ,那么 为 什么 他 们 还 需要 
知道 怎么 把 二 阶 微分 方程 转化 成 一 阶 微分 系统 呢 ? 我 们 可 以 从 两 方面 回答 这 
个 问题 :一 是 从 技术 方面 ,二 是 从 实用 方面 。 从 技术 方面 来 讲 ,所 有 的 建 模 者 都 
可 以 从 别人 的 例子 中 学 习 , 大 量 现 有 的 二 阶 微分 方程 模型 呈现 出 很 多 社会 科学 
家 想 研究 的 特征 。 例 如 ,Phaser 程序 提供 了 大 量 的 动态 系统 ,这 些 系统 必须 根 
据 二 阶 微分 方程 来 理解 。 如 果 我 们 不 能 很 好 地 研究 和 理解 别人 的 模型 ,我 们 怎 
么 创新 呢 ? 从 实用 方面 来 讲 , 相 似 的 数学 模型 常常 源 于 不 同 研究 领域 的 动态 过 
程 。 因 此 ,社会 科学 家 可 能 遇 到 二 阶 微分 方程 模型 ,虽然 这 些 模型 源 于 物理 科 
学 和 自然 科学 ,但 这 些 模型 的 结构 与 存在 相似 动态 特征 的 社会 和 政治 现象 相 
同 ,以 至 于 社会 科学 家 也 会 利用 这 些 模型 来 研究 社会 和 政治 现象 。 这 正 是 拥有 
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跨 领 域 建 模 的 广泛 视野 的 数学 家 阿 纳 托 尔 " 拉 波 波 特力 争 的 一 点 (Rapoport， 
1983:25 一 26)。 

此 外 ,二 阶 微分 方程 是 存在 二 阶 导 数 且 以 其 为 最 高 导数 的 方程 。 例 如 , 方 
程 5. 1 是 同 质 线性 微分 常 系数 方程 : 


d’ d 
aa Hb +e = 0 [5.1] 


方程 5. 1 是 同 质 的 ,因为 方程 右边 为 0。 方程 是 线性 的 ,因为 方程 中 不 存在 
非 线 性 项 ,如 y。 方 程 是 常 系数 ,因为 参数 a、5、c 不 变 。 如 果 方 程 5. 1 的 右边 
不 为 0, 则 方程 为 非 同 质 的 。 

有 两 种 处 理 二 阶 线性 微分 方程 的 一 般 方法 :第 一 种 是 找到 这 种 方程 的 确切 
解 ,第 二 种 是 把 这 个 问题 改 用 一 阶 方程 系统 来 表示 。 就 求解 二 阶 线性 微分 方程 
的 确切 解 来 讲 ,这 有 点 像 一 门 艺术 ,因为 它 包含 了 一 些 智能 猜测 ( 称 为 “猜测 检 
验 ” 法 ) ,根据 规则 并 通过 猜测 初始 值 而 获得 方程 的 完备 通 解 。 本 章 主要 讨论 另 
一 种 处 理 二 阶 或 更 高 阶 微分 方程 的 方法 , 即 把 这 些 方程 转换 成 一 阶 微分 方程 。 

在 这 里 ,强调 这 种 替代 方法 存在 多 种 原因 。 首 先 , 适 用 于 求 二 阶 和 更 高 阶 
线性 微分 方程 通 解 的 方法 常常 不 能 用 于 非 线性 微分 方程 。 其 次 ,关于 二 阶 和 更 
高 阶 线性 微分 方程 的 求解 方法 的 讨论 是 相当 标准 的 ,常常 能 在 任何 讨论 微分 方 
程 的 书籍 中 找到 。 而 且 , 在 下 一 章 讨 论 有 关 微 分 方程 系统 的 稳定 性 分 析 时 ,会 
涉及 大 量 这 方面 的 内 容 。 感 兴趣 的 读者 能 在 布 兰 查 德 等 人 (2006:324 一 329) 和 
齐 尔 (2005: 第 4 章 ) 的 文章 中 找到 求 二 阶 和 更 高 阶 线性 微分 方程 确切 解 的 方法 
的 完整 讨论 。 

更 重要 的 是 ,前 面 提 到 的 替代 方法 能 用 于 解决 二 阶 和 更 高 阶 微分 方程 的 定 
性 行为 ,这 与 本 书 通 篇 使 用 的 微分 方程 建 模 方法 有 很 多 相似 之 处 。 实 际 上 ,这 
些 方 法 更 适用 于 我 们 的 目的 ,因为 它们 把 求 二 阶 或 更 高 阶 微分 方程 确切 解 的 问 
题 转化 成 求解 一 阶 微分 方程 系统 的 问题 。 如 果 读 者 想 用 数值 分 析 法 来 研究 微 
分 方程 ,那么 非常 有 必要 这 样 做 。 实 际 上 , 这 种 方法 越 来 越 受 到 数学 家 的 青睐 。 
即便 如 此 ,读者 应 该 注意 ,这 里 偏好 的 方法 (处 理 一 阶 微分 方程 系统 ) 绝 不 是 所 
有 人 都 支持 。 有 些 读者 也 许 发 现 , 在 某 些 情况 下 , 求 二 阶 或 高 阶 线性 微分 方程 
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确切 解 的 传统 方法 非常 有 帮助 。 下 一 章 在 稳定 性 分 析 的 情形 下 讨论 这 个 问题 
的 做 法 将 非常 有 启发 性 。 


二 阶 和 更 高 阶 微分 方程 


将 二 阶 和 更 高 阶 微分 方程 转换 成 一 阶 微分 方程 系统 非常 容易 (Blanchard et 
al, ，2005:159 一 161)。 这 种 转换 不 会 丢失 信息 或 失去 一 般 性 。 此 外 ,使 用 数值 
分 析 法 研究 二 阶 或 更 高 阶 微分 方程 时 ,这 类 转换 是 非常 必要 的 。 

例如 ,我 们 有 任何 一 个 高 于 一 阶 的 微分 方程 。 为 了 把 这 个 方程 转换 成 一 个 
微分 方程 系统 ,首先 要 把 最 高 次 导数 单独 放 在 方程 的 一 边 ,其 他 项 放 在 方程 的 
男 一 边 。 我 们 以 方程 5. 2 为 例 , 使 用 科 洽 克 (1989:6 一 7) 建 议 的 符号 和 表达 
方式 : 





ga age eae [5.21 


为 了 继续 下 一 步 ,我 们 需要 知道 除了 最 高 阶 导 数 之 外 其 他 项 的 初始 条 件 
(如 方程 5. 2 的 左边 ) 。 因 此 ,我 们 需要 初始 条 件 
yb) Æ t Ñ dy/dt 的 值 ,…, 在 4 点 d”'y/dr"!' 的 值 [5.3] 
现在 ,我 们 引进 新 变量 。 这 些 变量 将 代替 y, dy/dt, =, d" | y/dt"'. H 
于 所 有 这 些 都 会 改变 ,所 以 我 们 从 中 生成 新 变量 ,并 把 它们 作为 微分 方程 系统 
的 分 离 项 。 新 变量 形 如 : 


a(t) = dy/dt*… [5. 4] 
TA = da" Wd 


现在 ,我 们 想 把 所 有 xz; 变量 求 导 , 以 便 建立 一 个 能 使 用 这 些 导数 的 微分 方 
程 系 统 。 因 此 ,我 们 得 到 : 


dr1i/di = x, MAITE 5. 4 中 得 到 ) 
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dzrz/dt = x3( 也 从 方程 5. 4 中 得 到 ) 


dr/dt = F(x1, Xs，…，X,)( 从 方程 5. 2 中 得 到 ,并 替换 x) 


在 正常 情况 下 ,我 们 能 用 RK4 法 来 处 理 这 一 系列 方程 。 记 住 , 这 些 变量 的 


初始 条 件 可 以 从 方程 5. 3 得 到 。 因 此 ， 
Tı (to) = y(to) 
X2(to) = dy/dt to) 
In (to) = d y/dt™ Cto) 


到 此 ,完成 转换 。 
接 下 来 ,请 思考 二 阶 微分 方程 5. 5: 


Py qay 
dt? y dt Wy 


我 们 从 设 定 新 变量 zx; 开始 。 因 此 ,我 们 得 到 : 
a(t) = y Mx) = dy/dt 
通过 代 换 ,我 们 可 以 得 到 新 的 一 阶 微分 方程 系统 : 
dx,/dt = x2 


dx»/dt = 1202 — 10z; 


[5,5] 


L5. 6] 


为 了 用 RK4 法 数值 分 析 这 个 微分 方程 系统 ,我 们 需要 知道 y( 即 x;) 和 


dy/di( 即 zx;) 的 初始 值 。 其 他 例子 可 以 参见 科 治 克 (1989:6 一 7)。 


非 自 治 微分 方程 


在 政治 学 中 ,一 个 “自治 ”地 区 或 团体 是 自主 管理 的 实体 ,其 至 在 一 个 大 学 
里 会 有 自治 委员 会 。 其 自治 的 理念 在 于 ,这 种 地 区 或 团体 不 依赖 外 在 条 件 而 运 
行 。 例 如 ,一 个 真正 自治 的 团体 做 事 的 时 候 ,不 必 请 求 别 人 的 许可 。 自 治 在 微 
分 方程 中 的 意思 也 与 之 类 似 。 自 治 微分 方程 基于 它们 自身 的 内 在 值 来 运作 。 
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实际 上 ,微分 方程 的 自治 系统 仅仅 基于 因 变量 的 值 来 运作 。 但 是 ,一 个 非 自治 
系统 在 运作 时 , 则 需要 除 因 变 量 之 外 的 其 他 信息 ,同时 也 需要 自 变 量 的 值 。 因 
此 , 非 自 治 微分 方程 是 模型 中 也 包括 自 变量 上 的 微分 方程 。 例 如 ,方程 5.7 是 包 
括 所 请 “ 受 迫 谐振 子 ” 成 分 的 非 自治 微分 方程 : 

dx/dt = ay — mx + g{ cos(pt) ] [5.7] 


读者 将 会 注意 到 ,这 个 方程 是 对 理 查 森 军事 竞赛 模型 (方程 4. 1) 稍 作 修正 
而 得 到 的 。 在 这 里 ,假设 国家 X 的 军备 开支 将 经 历 循环 变化 。 这 些 变化 可 能 是 
选举 循环 的 一 个 后 果 。 在 这 个 循环 中 ,国家 领导 人 在 普选 前 夕 为 了 获得 更 多 选 
票 而 试图 激 起 对 国家 Y 的 担忧 。 由 于 自 变 量 上 的 值 包括 在 模型 中 ,所 以 这 个 模 
型 是 非 自 治 的 。 

在 执行 数值 分 析 实 验 时 ,有 几 种 方法 可 以 处 理 数 值 模型 中 包括 自 变量 的 情 
形 。 其 中 一 种 方法 是 , 仅 在 RK4 法 的 步 长 随 着 时 间 推 进 前 移 时 ,记录 上 值 。 但 
更 一 般 的 方法 是 通过 产生 一 个 新 的 方程 来 增加 系统 的 维度 。 因 此 ,我 们 构建 一 
个 新 变量 z+ ,其 中 ,n 是 原始 微分 方程 系统 的 维度 (如 因 变 量 的 数量 ), 则 新 的 
微分 方程 是 : 


dEn 


t 1 [5.8] 


初始 条 件 是 Te (0) = bo o 

把 方程 5. 8 对 上 进行 积分 得 到 解 zw = ttto (Koçak, 1989:7 一 8)。 现 在 我 
们 得 到 这 个 新 变量 zu ,并 用 它 去 替代 系统 中 所 有 的 t 

例如 ,用 这 种 方法 得 到 的 新 理 查 森 军备 竞赛 模型 如 下 : 


dx, /dt = ar, —mr, + gl cos(pr;) | [5. 9 | 
dx»/dt = bx, — nx +h [5. 10 | 
dx;/dt = 1, x (0) = to C5. 11] 


请 注意 ,我 们 把 所 有 的 变量 都 变 成 了 xz; 的 形式 。 有 趣 的 是 ,这 个 理 查 森 军 
备 竞 赛 模型 有 可 能 处 理由 于 在 方程 5.9 中 纳入 受 迫 谐振 子 而 形成 的 高 度 纵向 变 
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异 (Brown，1995b) 。 
本 章 小 结 


本 章 首先 集中 介绍 了 把 一 个 二 阶 或 更 高 阶 微分 方程 转换 成 一 阶 微分 方程 
系统 的 方法 。 这 样 做 的 主要 目的 之 一 是 ,方便 数值 分 析 自 然 科 学 和 社会 科学 中 
常用 的 二 阶 和 更 高 阶 微分 方程 模型 。 本 书 介绍 的 数值 方法 (如 RK4 法 ) 仅 适用 
于 一 阶 微分 系统 ,因此 从 这 点 上 来 讲 ,把 更 高 阶 微分 方程 转换 成 一 阶 微分 方程 
系统 是 非常 必要 的 。 社 会 科学 家 常常 发 现 , 一 个 社会 过 程 和 一 个 用 二 阶 微分 方 
程 模拟 的 物理 过 程 的 某 一 个 或 某 几 个 方面 存在 动态 类 似 之 处 。 因 此 ,理论 家 们 
可 以 通过 这 种 处 理 更 高 阶 微分 方程 的 方式 来 进一步 探索 与 这 些 模 型 有 关 的 更 
高 阶 动态 系统 。 

本 章 还 介绍 了 处 理 非 自治 微分 方程 的 一 种 方法 。 这 种 方法 可 以 和 用 于 更 
高 阶 微分 方程 的 方法 相 比较 ,从 某 种 意义 上 来 说 ,可 以 增加 系统 的 维度 (在 这 个 
例子 中 是 增加 一 维 ) 来 作为 记录 自 变 量 : 的 一 种 方式 。 因 此 ,一 个 非 自治 微分 方 
程 可 以 写成 由 两 个 一 阶 自治 微分 方程 组 成 的 系统 。 本 书 使 用 的 数值 方法 (如 
RK4) 能 像 其 用 于 所 有 一 阶 微分 方程 系统 那样 来 处 理 这 个 微分 系统 。 


第 6 | 线性 微分 方程 系统 的 稳定 性 分 析 


微分 方程 模型 分 析 几 乎 总 是 至 少 包括 3 个 主要 方面 。 首 先 应 该 识别 均衡 点 
和 系统 的 吸引 域 ,这 可 能 包括 均衡 域 的 识别 。 其 次 是 描述 因 变 量 在 相关 的 相位 
空间 内 的 轨迹 行为 。 再 次 是 描述 进入 均衡 点 的 近 域 的 轨迹 行为 。 本 章 集中 讨 
论 关 于 一 阶 线性 微分 方程 系统 的 第 三 步 。 

不 管 是 线性 方程 还 是 非 线性 方程 ,微分 方程 系统 在 均衡 点 附近 的 行为 通常 
非常 类 似 ( 偶 尔 出 现行 为 差异 大 的 情形 )。 离 均衡 点 越 远 ,线性 和 非 线性 微分 方 
程 的 行为 可 能 越 大 相 径 庭 ,本 书 前 面 提 到 的 数值 方法 对 于 描述 这 些 行为 非常 重 
要 。 但 是 ,在 一 个 二 维系 统 的 均衡 点 附近 ,微分 方程 系统 通常 出 现 6 种 基本 行 
为 ,每 种 行为 都 非常 值得 我 们 重视 。 我 们 能 通过 检验 这 个 线性 例子 来 清晰 地 识 
别 这 些 行为 。 


一 个 系统 中 的 稳定 性 如 何 突 变 的 一 个 例子 


首先 ,我 们 通过 介绍 一 个 微分 方程 系统 非常 容易 有 均衡 点 , 且 均 衡 点 可 以 
根据 系统 参数 值 的 不 同 而 呈现 非常 不 同 的 稳定 性 特征 ,来 讨论 稳定 性 分 析 。 下 
面 以 理 查 森 军 备 竞赛 模型 为 例 。 方程 4. 3 和 方程 4. 4 中 呈现 的 理 查 森 军备 竞赛 
模型 的 均衡 值 是 X* = Cah +en)/Om—ab) 和 Y* = (bg —hm)/(mn —ab), 4i 
前 面 所 提 到 的 ,只 要 wm — ab A 0, 均衡 值 就 存在 。 也 可 能 存在 改变 参数 值 但 是 
均衡 点 (X,Y* ) 近 似 保持 不 变 的 情形 , 即 尽管 参数 值 发 生变 化 ,但 均衡 点 几乎 
不 变 。 这 也 许 需 要 在 某 一 时 点 改变 至 少 一 个 参数 值 ,以 致 均衡 解 保持 相同 。 在 
现实 中 ,这 个 系统 的 观察 者 也 许 无 法 发 现任 何 差异 ,因为 观察 者 也 许 仅 能 观察 
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到 在 均衡 点 时 ,每 个 国家 的 军 购 数量 。 但 是 ,如 果 参 数 变化 很 大 以 致 mm — ab 从 
正 值 变 成 负 值 (如 wm < ab) , 那么 ,均衡 值 的 稳定 性 也 会 突然 从 稳定 变 得 不 稳定 
(Richardson, 1960;24—28; Rapoport，1983:126 一 128) 。 实 质 上 ,这 意味 着 ,如 
果 最 近 的 历史 表明 一 切 都 是 “安全 ”和 稳定 的 ,那么 ,一 个 国家 会 突然 发 现 自己 
处 于 失控 的 军备 竞赛 中 。 在 连环 画 中 ,从 来 看 不 到 这 种 情形 发 生 。 

前 面 描述 的 现象 与 所 谓 “ 突 变 论 ” 的 动态 建 模 领域 有 关 , 这 在 我 写 的 其 他 书 
中 有 过 介绍 和 应 用 (Brown，1995a、1995b)。 宏 观 社会 系统 的 行为 动态 依赖 于 
特定 状态 或 系统 均衡 点 的 局 部 稳定 特性 。 一 些 科学 家 通过 给 他 们 的 系统 设 定 
限定 值 来 处 理 突然 的 变化 。 当 特定 的 参数 值 超过 这 些 限 定 值 时 ,系统 的 行为 能 
改变 ,就 像 有 两 套 “ 规 则 ”控制 着 系统 ,分 别 适用 不 同 的 情形 。 然 而 , 拉 波 波 特 争 
论说 ,这 是 临时 的 ,描述 了 系统 的 行为 而 不 描述 其 潜在 结构 (Rapoport，1983: 
127)。 但 将 突变 论 应 用 到 微分 方程 中 时 ,我 们 是 通过 直接 依赖 潜在 机 制 来 描述 
系统 的 突变 行为 的 。 这 将 有 助 于 促进 微分 方程 系统 稳定 性 的 研究 一 一 理解 是 
什么 引起 系统 稳定 与 否 ,或 有 哪 种 稳定 性 或 不 稳定 性 一 一 让 我 们 有 可 能 从 一 个 
新 的 角度 理解 社会 系统 。 实 际 上 ,这 是 目前 把 微分 方程 系统 应 用 到 真实 现象 的 
一 个 研究 领域 。 


标量 法 


为 了 描述 二 维 微分 方程 系统 在 均衡 点 附近 的 6 种 基本 行为 ,下 面 以 方程 

6. 1 和 方程 6. 2 为 例 , 来 处 理 线性 微分 方程 。 这 些 方程 类 似 于 理 查 森 军 备 竞 赛 
模型 : 

dx/dt = ar + by [6.1] 


dy/dt = cx +ky [6. 2] 


首先 ,我 们 要 注意 ,原点 是 这 个 系统 的 均衡 点 ,这 能 通过 检验 或 把 方程 6. 1 
和 方程 6. 2 同时 设 定 为 0 并 求解 这 两 个 方程 得 到 。 现 在 把 方程 6. 1 和 方程 6. 2 
转换 成 一 个 更 高 阶 微分 方程 。 首 先 对 方程 6. 1 两 边 求 导 , 得 到 : 
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d'z jdr pdy : 
ae ame VA pa] 


下 一 步 是 把 方程 6. 2 的 dy/dt 和 方程 6. 1 中 的 y 代入 方程 6. 3, 得 到 方 
程 6. 4: 


ae dx 
TE (a +h) E + (ak—be)x =0 [6. 4] 








我 们 将 用 “猜测 检验 法 ”求解 这 个 二 阶 微 分 方程 (Blanchard et al. , 2005: 117— 
120, 194—195). 

先 猜测 zx = Ae", 其 中 7 为 常数 ,A 为 任意 常数 ,我 们 希望 这 是 x 的 一 个 解 。 
再 次 ,z 的 解 可 能 是 不 包含 任何 导数 的 算术 方程 ,给 定 任何 自 变 量 i 的 值 ,都 会 
得 出 z 的 值 。 猜 测 可 能 解 Ae” 的 依据 之 一 是 相关 的 一 阶 线性 微分 方程 的 解 ( 参 
见方 程 2.4) , 另 一 个 依据 是 ,如 果 方 程 6. 4 中 不 同 导数 的 线性 组 合 都 抵消 为 0， 
那么 ,导数 在 某 种 程度 上 可 能 是 重复 的 。 

请 注意 , dr/dt = rAe", d’x/dt® = r Ae” , 把 这 些 值 代入 方程 6. 4 得 到 方 
程 6. 5: 

r Ae" — (a+k)rAe" + (ak — bc )Ae” = 0 [6.5] 


提取 公 因 子 Ae (注意 e 40), 我 们 得 到 所 谓 的 “特征 方程 ”如 方程 6. 6: 
r —(atk)r+ (ak —bk) = 0 [6.6] 


因此 ,看 起 来 只 要 我 们 能 找到 参数 r 的 适当 值 , 就 能 得 到 可 能 解 x = Ae", 

我 们 关注 两 个 微分 方程 (方程 6. 1 和 方程 6. 2) 组 成 的 系统 在 均衡 点 (0，0) 
附近 的 行为 。 因 变量 的 解 依赖 于 特征 方程 的 根 。 我 们 能 用 二 次 公式 或 对 更 高 
阶 系统 用 Newton 方法 得 到 根 。 就 自 变 量 x 而 言 ,我 们 想 求解 参数 x 的 值 以 满 
足 其 他 参数 (a、b、c 和 A) 值 给 定时 的 方程 6. 6。 注 意 ,方程 6. 6 有 两 个 根 ( 和 
rz)。 如 果 我 们 仅仅 把 zx = Ae" 作为 方程 的 解 , 则 x 有 两 个 不 同 的 根 。 因 此 ,我 
们 要 想 办 法 把 这 两 个 解 合 成 一 个 。 

在 微分 方程 理论 中 ,有 一 个 礁 加 原理 (Zill，2005:130 一 134)。 这 个 原理 也 
称 为 “线性 原理 ”(Blanchard et al. , 2005;114—116; Morris & Brown, 1952: 
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69 一 71)。 这 个 原理 可 以 分 成 两 部 分 。 首 先 , 如 果 找 到 方程 的 解 , 则 这 个 解 乘 以 
任何 常数 仍 是 这 个 方程 的 解 。 这 能 很 容易 得 到 证 明 。 因 为 Ae” 是 x 的 一 个 解 ， 
把 sAe” (和 其 导数 ) 代 入 方程 6. 4 将 同样 得 到 方程 6. 5 一 一 两 边 消 除 公 因子 会 把 
参数 ; 消去 ,得 到 方程 6. 5。 其 次 ,全 加 原理 还 表明 ,如 果 微 分 方程 两 个 解 , 那 
么 这 两 个 解 的 任意 线性 组 合 也 是 这 个 方程 的 解 。 这 也 适用 于 更 高 阶 微分 方程 ， 
不 同 的 是 ,这 是 由 更 多 解 组 成 的 线性 组 合 。 这 两 个 解 的 线性 组 合 是 二 阶 同 质 微 
分 方程 的 通 解 ,下 面 将 具体 介绍 如 何 得 到 这 个 通 解 。 

请 记 住 ,我 们 这 里 所 做 的 是 为 了 确定 二 阶 微分 方程 系统 因 变量 的 行为 。 二 
阶 微分 方程 的 解 包括 一 个 参数 值 ", 它 有 两 个 值 。 这 意味 着 , 这 个 微分 方程 的 行 
为 将 依赖 于 特征 方程 6. 6 的 根 。 

此 时 ,我 们 用 一 个 实例 来 看 这 个 求解 过 程 。 在 这 个 例子 中 ,我 将 用 丹 比 
(1997:52 一 54) 建 议 的 参数 值 。 我 们 把 方程 6. 1 和 方程 6. 2 中 的 参数 都 设 定 为 
具体 的 值 ,得 到 下 面 的 方程 6. 7 和 方程 6. 8: 


dx/dt = 2x+y [6.7] 


dy/dt =x+2y [6.8] 





这 意味 着 , a= 2, 0 二 1,c 二 1, k= 2, 把 这 些 参 数值 代入 方程 6. 6, 得 到 
方程 6. 9: 





7 一 4r 十 3 二 0 L6. 9] 


使 用 二 次 公式 ,得 到 两 个 根 : ni = 1 Al, = 3. 

我 们 现在 需要 用 这 两 个 根 得 到 这 个 系统 的 通 解 。 由 于 系统 是 相互 依赖 的 ， 
因此 zz 依赖 于 y, 反 之 亦 然 。 所 以 ,我 们 需要 把 x Aly 的 解 都 求 出 来 。 我 们 将 使 
用 猜测 法 , 即 猜测 2 = Ae", y = Be” , 请 注意 , dr /dt = rAe” , dy/dt = rBe", 
然后 把 这 些 值 代入 原始 方程 6. 7 和 方程 6. 8 中 ,得 到 : 

rAe” = 2(Ae”) + Be” 
rBe" = Ae” + 2( Be” ) 


方程 两 边 同时 除 以 e” ,再 整理 这 两 个 方程 ,得 到 : 
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A(2—r)+B=0 
A+ B(2—r) =0 


请 注意 ,只 有 当 det = 0 时 ,这 两 个 方程 才能 求 出 A 和 B 的 
有 效 解 。 

这 是 得 到 系统 的 特征 方程 的 男 一 种 方法 。 我 在 这 里 介绍 ,以 便 读者 注意 到 
这 里 的 标量 法 和 后 面 介绍 的 矩阵 法 两 者 之 间 重 要 的 相似 之 处 。 解 上 面 的 方程 
得 到 两 个 根 : n = 1 和 x = 3。 把 这 两 个 根 代 入 上 面 的 两 个 方程 中 求解 A 和 B。 
注意 , 当 n 二 1 时 , A = 一 B; 4n=3h,A=B. 其 中 ,A 为 任意 实数 。 为 了 
区 分 ,我 们 用 A 和 A 来 代替 。 

现在 我 们 可 以 用 A 来 表示 方程 的 解 。 因 此 ,我 们 有 4 个 解 ,分 别 是 : 








AF. 


iy 一 Aie: 


y 一 一 Aie: 


r= Ase” 
y= Aze” 
HST HU BE se APE VAS NP REZ. RERE, i 
方程 6.4 的 x 和 y 的 通 解 可 以 表示 为 : 
> ee Aje + Aze” [6. 10 | 
y =— Ave + Ae” [6.11] 
其 中 ,A, 是 依赖 于 zx 和 yy 的 初始 条 件 的 任意 常数 。 这 些 常数 类 似 于 一 阶 线性 微 
分 方程 的 解 (方程 2. 4) 中 的 常数 w 。 注 意 , 方 程 6. 10 和 方程 6. 11 分 别 是 zx 和 >y 
的 解 的 线性 组 合 ,每 个 解 都 用 了 方程 6. 9 的 一 个 根 。 
读者 应 该 清楚 一 点 , 因 变 量 x 和 yy 随时 间 而 变化 的 行为 将 依赖 于 特征 方程 
的 根 。 从 方程 6. 10 和 方程 6. 11 中 可 以 看 出 ,由 于 这 两 个 根 都 是 正 值 ,所 以 随 着 
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时 间 的 推移 ,z 和 > 的 值 将 呈 指 数 增加 。 这 意味 着 ,这 个 系统 的 均衡 值 ( 如 方程 
6.7 和 方程 6.8 所 定义 的 ) 是 不 稳定 的 ,这 个 均衡 值 本 身 ( 如 原点 ) 被 称 为 一 个 
“不 稳定 的 节点 ”。 


和 矩阵 法 


在 这 点 上 ,我们 需要 退 一 步 ,用 一 种 不 同 的 方法 , 即 和 矩阵 ,来 评估 微分 方程 
的 线性 系统 的 行为 。 从 我 的 角度 来 讲 , 这 种 矩阵 法 更 具 一 般 性 且 更 可 取 ( 我 在 
下 面 将 论述 原因 ) ,虽然 一 些 读者 可 能 更 喜欢 用 前 面 描述 的 “猜测 检验 法 ?来 求 
解 微分 方程 。 这 种 矩阵 法 不 仅 能 用 来 处 理 线性 微分 方程 ,而 且 也 能 用 来 处 理 非 
线性 微分 方程 ,这 在 下 一 章 将 进行 讨论 。 

我 们 首先 介绍 两 个 微分 方程 (方程 6. 1 和 方程 6. 2) 组 成 的 系统 的 矩阵 形 
式 。 我 们 不 会 像 之 前 那样 ,把 这 个 系统 转换 成 一 个 二 阶 方程 。 因 此 ,我 们 把 这 
些 原 始 方程 写成 矩阵 形式 : 

dY/dt = AY [6. 12] 


2 | 
1 2 
矩阵 ARRI REGE) 中 的 各 元 素 是 方程 6. 7 和 方程 6. 8 组 成 的 系统 的 系 


数 。 向 量 Y 有 两 个 元 素 一 一 + 和 y, 它 们 是 这 个 系统 的 因 变量 。 根 据 方程 6. 1 
和 方程 6. 2: 
a b 
e 


根据 全 加 原理 ,我 们 知道 ,能 通过 线性 组 合 任 意 两 个 给 定 的 解 来 得 到 这 个 
方程 系统 的 解 。 因 此 ,如 果 Y O 和 Y;(z) 是 系统 (方程 6. 13) 的 解 ( 即 特 解 ) ,从 
而 我 们 能 得 出 : 


其 中 ， 
AS 





dx /dt 
dy /dt 


dY _ K 


7 [6.13] 








in + by 
see te ey 














y 


w Yı (t) + w: Y; Ct) L6. 14] 
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也 是 系统 的 解 ( 即 通 解 )。 在 这 里 ,我 们 用 w: 表示 任意 常数 。 求 这 个 通 解 需要 
先 求 这 两 个 特 解 , 将 这 两 个 特 解 分 别 与 原始 系数 矩阵 相 乘 得 到 相同 的 向 量 Y( 在 
很 多 例子 中 ,这 些 解 称 为 “直线 解 ”, 因 为 在 相位 图 中 ,识别 的 轨迹 是 直线 )。 因 
此 ,我 们 实际 上 在 寻找 两 种 事物 一 一 既 需 要 找到 一 个 能 与 系数 矩阵 的 作用 一 样 
的 标量 ,也 需要 因 变 量 的 值 。 这 些 值 和 标量 相 乘 能 像 把 方程 6. 13 和 系数 矩阵 相 
乘 那样 得 到 相同 的 结果 。 

把 向 量 V 中 因 变 量 的 值 分 组 。 因 此 , V= (x,y), 我 们 需要 求 V 的 值 以 使 
下 列 方程 成 立 : 


£ T 





AV=A =} =AV [6. 15 ] 














y 
或 者 , (A 一 4DV 二 0, 在 这 里 ,4 是 那个 当 与 向 量 V 相 乘 时 与 系数 矩阵 A 作用 一 
样 的 标量 ,I 是 单位 阵 。 标量 也 称 为 矩阵 A 的 一 个 “特征 值 ”, 向 量 V 也 称 为 对 
应 于 特征 值 4 的 “特征 向 量 ”。 方程 6. 15 也 可 以 写成 : 


y 


ax + by = àr 
cx tky = hy 
或 
(a—A)x+ by = 0 [6. 16] 
cx + (R—-A)y = 0 [6.17] 


FAA det| A 一 XI| = 0 时 ,这 个 系统 才 存在 有 效 解 。 因 此 ,我们 设 定 


Q 一 从 b 
det =0 [6. 18 ] 
k—ì 


C 
把 方程 6. 18 展开 成 算术 式 , 得 到 : 
à? — (a +k)à + (ak — be) = 0 


这 个 方程 是 系统 的 “特征 多 项 式 ”。 系 数 矩 阵 A 的 特征 值 是 这 个 多 项 式 的 根 。 
由 于 这 是 二 次 方程 ,所 以 有 两 个 根 。 使 用 前 面 线性 系统 (方程 6. 12) 的 例子 , 方 
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程 6. 12 可 以 写成 : 


det 





2-A 1 | 
= 0 
1 2—ì 
或 者 入 一 和 包 十 3 二 0。 在 这 里 , = 1 MA 二 3。 
请 注意 ,这 个 系数 矩阵 的 特征 值 与 使 用 标量 法 求 得 特征 方程 (方程 6. 9) 的 
根 一 样 。 这 并 非 偶然 。 实 际 上 ,我们 很 快 能 看 到 , 当 我 们 计算 特征 方程 6. 6 的 根 
时 ,我 们 一 直 在 处 理 特征 值 。 方 程 2.4 中 的 参数 a 是 一 个 一 维 简单 一 阶 线性 微 
分 方程 的 一 个 特征 值 。 
现在 我 们 求 得 系统 (方程 6. 12) 的 特征 值 , 然 后 要 求 这 些 特征 值 的 特征 向 
量 。 把 这 些 特征 值 代入 (A 一 ADV = 0 (一 次 代入 一 个 特征 值 ) 中 ,得 到 形 如 方程 
6. 15 的 表达 式 , 然 后 求 得 特征 向 量 。 这 相当 于 同时 求解 方程 6. 16 和 方程 6. 17 
的 标量 形式 。 我 们 继续 用 矩阵 形式 ,通过 求解 下 面 的 系统 ,得 到 特征 值 为 = 1 
时 ,对 应 的 特征 向 量 : 
ey 1 | | 1 
V 一 
1 2-a {i i 


把 方程 6. 19 展开 ,得 到 两 个 相同 的 方程 , 即 x 十 y = 0, 这 意味 着 x =—y, 
任何 形 如 (一 y,，y) 的 向 量 都 是 与 特征 值 4. = 1 有关 的 特征 向 量 ,只 要 y 关 0。 例 
如 ,( 一 1, 1), (2, —2), (一 5, 5) 都 是 与 特征 值 % = 1 有关 的 等 价 的 特征 向 量 。 
这 个 特征 向 量 记 为 W = C y, y) 

当 ) = 3 时 ,把 这 个 值 代入 系统 中 ,得 到 向 量 方程 ; 


二 0 [6.19] 











(2—3)a+ly=0 
lz+(2—3)y=0 
从 上 式 可 得 到 两 个 相同 的 方程 , x = y。 这 意味 着 , 形 如 (y，y) 的 任何 向 量 
都 是 这 个 系统 关于 特征 值 A = 3 的 特征 向 量 。(1, 1) 就 是 这 个 特征 向 量 之 一 。 
这 个 特征 向 量 记 为 Ve = (ys yy)。 
一 些 读 者 会 注意 到 ,V! A V 是 线性 无 关 的 ,因此 ,这 两 个 向 量 可 以 组 
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成 一 个 二 维 空间 R* 。 这 意味 着 ,R* 空间 中 的 任何 点 都 可 以 用 这 两 个 向 量 的 
线性 组 合 来 表示 。 利 用 这 些 结果 和 方程 6. 13 ,我们 能 把 这 个 方程 系统 的 通 
MEIN: 

Y(t) = we" V, + we” V [6. 20] 


请 记 住 ,每 个 向 量 Vi 和 Ve 都 包括 x 和 y。 只 要 特征 向 量 的 形式 合适 , 则 通 
解 使 用 哪个 特征 向 量 并 不 重要 。 例 如 ,由 于 (一 1, 1), C1, 一 1), (2, 一 2) 是 对 
DAF A = 1 的 特征 向 量 的 一 些 例子 (由 于 它们 相互 之 间 就 相差 一 个 系数 ) ,所 以 
我 们 能 在 解 中 使 用 其 中 任何 一 个 向 量 。 为 了 简便 起 见 ,我 将 使 用 与 特征 值 A, = 
1 相对 应 的 特征 向 量 (1 ,一 1) 以 及 与 特征 值 A, = 3 对 应 的 特征 向 量 (1, 1)。 根 
据 这 个 例子 ,这 意味 着 ,微分 方程 系统 xz 的 任意 解 是 zx (2) = we Hwe”, y 的 任 
意 解 是 y(t) =— we + we, 这 与 之 前 我 们 使 用 标量 法 得 到 的 结果 相同 (参见 
方程 6. 10 和 方程 6. 11) 。 最 后 一 步 是 求解 这 两 个 任意 常数 zw 和 ws。 为 了 求 
这 两 个 常数 ,我 们 设 定 上 = 0, 并 利用 因 变 量 x。 和 yw 的 初始 条 件 来 解 这 两 个 联 
立方 程 组 。 

总 而 言 之 ,这 两 个 一 阶 线性 微分 方程 组 成 的 系统 有 两 个 不 相等 的 正 实 特 征 
{EL A, ) ,其 通 解 如 方程 6. 21 所 示 : 


Y(t) = we''V, + wee! V, [6. 21] 


其 中 ,Vi 是 特征 向 量 ,zw 是 依赖 于 因 变 量 初始 值 的 任意 常数 。 

这 里 有 两 点 需要 注意 。 首 先 , 当 特 征 值 相同 时 ,或 当 其 中 一 个 特征 值 为 0 
时 ,或 当 特征 值 是 复数 时 ,前 面 介绍 的 求解 一 阶 微分 方程 系统 的 通 解 的 过 程 在 
这 3 种 情况 下 稍 有 不 同 。 从 某 种 程度 上 讲 , 这 是 个 坏 消 息 ,因为 为 了 求 这 类 线性 
系统 的 通 解 ,我 们 需要 借用 一 些 其 他 方法 。 第 二 点 同样 重要 , 且 是 个 好 消息 。 
对 于 一 阶 线性 微分 方程 组 成 的 系统 , 因 变 量 随 时 间 变 化 的 行为 依赖 于 系统 的 特 
征 值 ,而 不 是 特征 向 量 或 任意 常数 。 这 一 点 可 以 从 方程 6. 21 中 看 出 ,也 能 从 下 
面 的 例子 中 看 出 。 而 且 , 由 于 本 书 推荐 的 方法 是 使 用 数值 技术 来 求解 和 画 一 阶 
常 微分 方程 系统 ,所 以 ,一旦 我 们 理解 了 线性 系统 的 特征 值 的 重要 性 ,就 不 需要 
方程 的 通 解 ,我们 真正 需要 的 只 有 特征 值 。 当 然 ,值得 指出 的 是 ,在 出 现 能 用 数 
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值 分 析 处 理 很 多 计算 的 计算 机 之 前 ,线性 系统 的 通 解 比 线性 微分 系统 的 实际 应 
用 更 重要 。 


均衡 类 别 


为 什么 要 像 上 面 那 样 ,一 步 一 步 求 得 线性 微分 方程 系统 的 通 解 呢 ? 为 了 理 
解 特征 值 的 重要 性 ,这 也 有 必要 介绍 一 下 。 一 旦 知道 任意 常数 和 特征 向 量 都 不 
会 影响 线性 微分 方程 系统 的 行为 ,那么 ,特征 向 量 和 任意 常数 就 可 以 完全 省 掉 。 
相反 ,仅仅 根据 特征 值 把 线性 系统 的 行为 分 类 ,我 们 能 直接 使 用 数值 方法 来 解 
微分 方程 。 

虽然 下 面 描述 的 均衡 类 别 可 应 用 于 二 维 线性 微分 方程 系统 ,但 这 对 非 线性 
更 多 维系 统 是 不 够 的 。 例 如 , 三维 或 更 多 维 的 非 线性 系统 可 能 存在 潜在 的 “ 奇 
异 的 吸引 子 ”, 这 是 和 混沌 理论 有 关 的 现象 (Brown，1995b)。 混 沌 也 能 出 现在 
二 维 非 自治 的 非 线 性 系统 中 。 但 是 ,下 面 所 列 的 是 所 有 微分 方程 系统 研究 的 必 
要 起 点 ,不 管 它 的 阶 次 为 多 少 并 且 是 否 为 线性 。 在 下 一 章 介 绍 非 线 性 微分 方程 
系统 时 ,这 一 点 将 进一步 得 到 强调 。 


不 稳定 的 节点 


下 面 ,我 们 对 二 维 自治 一 阶 线性 微分 方程 系统 在 均衡 点 附近 的 行为 类 型 做 
一 个 分 类 。 我 们 首先 以 方程 6. 7 和 方程 6. 8 中 的 参数 值 为 例 。 在 这 里 ,特征 值 
为 = A, 3), 是 不 等 的 正 实 根 。 从 方程 6. 10 和 方程 6. 11 或 方程 6. 20 中 可 以 
看 出 , 随 着 时 间 的 增加 , 因 变 量 将 毫 无 边界 地 持续 增加 。 这 就 在 原点 生成 了 一 
个 不 稳定 的 节点 , 即 这 个 系统 的 均衡 点 。 这 类 均衡 点 也 称 为 “ 源 点 >”。 这 个 词 形 
象 地 描述 了 轨迹 从 这 点 散 开 ,就 像 太 阳 发 出 的 光 远 离 太阳 那样 。 这 个 系统 的 相 
位 图 (使 用 Phaser 作 图 ) 如 图 6. 1 所 示 。 请 注意 ,所 有 的 轨迹 都 往外 远离 原点 ， 
这 就 是 不 稳定 的 均衡 点 的 特征 。 
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注 : 初 始 条件 以 点 表示 。 所 有 的 运动 都 沿 着 显示 的 轨迹 从 初始 条 件 往 外 移动 。 
6.1 存在 不 稳定 均衡 点 的 二 维 线性 模型 


稳定 的 节点 








如 果 系 统 的 参数 值 改 成 a =—4,b=1ec=1,k=—2, 那么 ,原点 附近 的 
轨迹 行为 与 图 6. 1 将 相去 其 远 。 此 时 ,特征 值 为 4; = 一 3 土 V2, 是 不 相等 的 负 实 
数 。 从 方程 6. 21 可 以 看 出 ,由 于 特征 值 是 负数 ,所 以 e* 随 着 时 间 的 增加 会 趋向 








注 :初始 条 件 以 点 表示 。 所 有 的 运动 都 沿 着 显示 的 轨迹 从 初始 条 件 往外 移动 ,并 汇集 在 图 中 心 的 


图 6.2 存在 稳定 均衡 点 的 二 维 线性 模型 
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于 0。 由 于 参数 的 变化 ,轨迹 逐渐 趋向 均衡 点 。 在 这 种 情况 下 ,原点 是 个 "稳定 
的 节点 ”。 这 类 均衡 点 也 称 为 “ 沉 点 ”。 这 类 系统 的 相位 图 如 图 6. 2 所 示 。 请 注 
意 ,在 这 个 图 中 ,所 有 的 轨迹 都 移 向 原点 ,这 类 行为 是 在 吸引 场 域内 稳定 均衡 行 
为 的 特征 。 


鞍点 





如 果 把 这 个 线性 系统 的 参数 值 变 成 a = 1, b= 4, c = 2, k =—1, 则 特征 
值 变 成 = (3, 一 3)。 此 时 ,其 中 一 个 特征 值 是 正 实 根 , 男 一 个 特征 值 是 负 实 
根 。 读 者 也 许 能 猜 到 ,这 种 情形 本 质 上 是 前 面 “ 源 点 ”和 “ 沉 点 ”两 种 情形 的 综 
合 。 现 在 ,把 这 个 均衡 点 称 为 "鞍点 ”。 这 个 词 是 用 来 反映 马鞍 的 本 质 的 。 从 一 
个 对 角 的 方向 看 ,均衡 点 如 一 个 沉 点 ,附近 的 轨迹 都 拉 向 原点 。 从 男 一 个 对 角 
的 方向 看 ,均衡 点 将 像 一 个 原点 ,附近 的 轨迹 被 拉 离 原点 。 然 而 ,实际 上 ,只 有 
一 个 直线 解 能 永远 拉 向 原点 ,所 有 其 他 轨迹 最 终 都 会 受 外 力 的 影响 而 转向 离开 
均衡 点 。 所 以 这 样 的 均衡 点 是 不 稳定 的 。 
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图 6.3 起 点 为 鞍点 的 二 维 线性 模型 


这 是 比 一 个 简单 源 点 或 沉 点 更 复杂 的 情形 。 图 6. 3 描述 了 这 个 系统 在 原点 
附近 的 相位 图 。 把 方向 场 加 到 图 中 将 有 助 于 表现 轨迹 的 运动 方向 。 所 有 轨迹 
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流 的 起 点 都 由 点 表示 。 请 注意 ,从 图 的 左上 角 或 右 下 角 附近 起 始 的 轨迹 开始 都 
被 拉 向 原点 ,但 最 后 由 于 正 特征 值 的 不 稳定 特征 主导 这 个 系统 ,所 以 轨迹 会 
第 一 或 第 三 象限 从 原点 远离 。 这 个 没有 边界 的 行为 使 鞍点 变 得 不 稳定 。 


不 稳定 的 螺旋 线 





当 把 系统 的 参数 值 变 成 a =1,6=4,c=—2,k = 1 时 ,特征 值 变 成 存在 
实数 和 虚数 两 部 分 的 复数 ,特征 值 是 4; = 1 土 iV8。 这 种 情形 生成 了 不 稳定 的 螺 
旋 线 轨迹 。 这 些 螺 旋 线 来 源 于 特征 值 的 虚数 部 分 。 根 据 Euler 方法 ,我 们 可 以 
把 复数 写成 sin 和 cos 的 函数 形式 ,这 样 做 是 为 了 得 到 存在 复数 特征 值 的 线性 
微分 方程 的 实 解 (Blanchard et al. ，2006 :293 一 296) 。 虽 然 复 特征 值 的 虚数 部 
分 是 因 变 量 随时 间 震 荡 的 行为 的 主要 原因 ,但 实数 部 分 仍 能 决定 均衡 点 是 沉 
点 、 源 点 ,还 是 中 心 点 。 如 果 复 特征 值 的 实数 部 分 是 正 数 ,这 个 轨迹 将 从 原点 螺 
旋 形 往外 走 ,均衡 点 是 螺旋 点 的 源 点 。 

图 6.4 表示 有 正 实数 部 分 的 复 特征 值 的 系统 的 相位 图 。 图 中 有 4 个 初始 条 
件 。 请 注意 ,所 有 轨迹 都 从 原点 以 螺旋 线 的 形式 往外 移动 。 也 就 是 说 ,给 定 的 
这 些 参数 值 使 得 原点 变 成 一 个 不 稳定 的 均衡 点 。 


ES 
(CR 
RZ 





注 : 运 动 的 方向 是 沿 着 箭头 往外 远离 初始 条 件 (以 点 表示 )。 
图 6.4 存在 不 稳定 螺旋 线 的 二 维 线性 模型 
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稳定 的 螺旋 线 





下 面 把 参数 值 改 成 a 1,b=4,c=—2,k=—1, 如 果 复 特征 值 的 实 
数 部 分 是 负 的 ,那么 相位 空间 的 轨迹 螺旋 形 地 趋向 原点 ,这 个 均衡 点 是 一 个 
沉 点 。 此 时 ,这 个 系统 的 特征 值 是 4; = 一 1 土 iV8。 解 的 负 实数 部 分 会 产生 以 
稳定 螺旋 线 为 形式 的 沉 点 。 这 个 系统 的 相位 图 如 图 6. 5 所 示 。 这 张 图 中 有 4 
个 初始 值 。 请 注意 ,这 4 条 轨迹 都 以 螺旋 线形 式 趋 向 原点 ,此 时 ,原点 是 稳定 
的 均衡 点 。 











注 :运动 的 方向 是 沿 着 箭头 远离 初始 条 件 ( 以 点 表示 ) ,趋向 均衡 点 。 
图 6.5 存在 稳定 螺旋 线 的 二 维 线性 模型 


一 阶 线性 微分 方程 系统 的 均衡 点 的 最 后 一 类 是 椭圆 。 由 于 方程 系统 只 
虚 特 征 值 ,所 以 形成 了 椭圆 。 也 就 是 说 ,特征 值 的 实数 部 分 是 0。 如果 把 系统 
的 参数 值 设 为 a = 1, b= 4, c=—2, R=—1, 那么 特征 值 为 4 = 十 iV7。 这 
个 系统 的 相位 图 如 图 6. 6 所 示 。 现 在 的 原点 称 为 “中 心 点 ”, 所 有 轨迹 永远 转 
绕 着 这 个 中 心 点 运行 。 这 个 中 心 点 是 稳定 的 ,这 是 唯一 一 类 非 渐 近 型 的 稳定 
均衡 点 。 
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注 :运动 的 方向 如 箭头 所 示 。 


图 6.6 存在 椭圆 和 中 心 点 的 二 维 线性 模型 


稳定 标准 的 小 结 


任何 维度 的 线性 微分 方程 系统 的 稳定 性 标准 恰好 都 能 用 图 6. 7 所 示 的 复 平 
面 图 来 总 结 。 在 图 6. 7 中 ,x 轴 表 示 一 个 系统 特征 值 的 实 值 部 分 ,y 轴 表 示 虚 值 
部 分 。 现 在 的 讨论 类 似 于 梅 (May,， 1974:23 一 26) 的 文章 中 ,关于 这 些 技术 应 用 
于 生态 系统 建 模 的 讨论 。 虽 然 本 书 结构 紧凑 ,但 这 样 讨论 有 助 于 解决 各 种 线性 
微分 方程 的 分 析 解 的 完整 性 问题 。 想 进一步 了 解 更 详细 的 讨论 的 读者 ,可 以 参 
考 介 绍 微分 方程 的 更 详细 的 书 (Blanchard et al. , 2006), 

现在 的 问题 是 ,怎么 通过 把 线性 微分 方程 有 关 的 特征 值 和 这 些 行为 的 重要 
成 分 联系 起 来 表现 这 些 行 为 。 从 方程 6. 21 能 看 出 ,如 果 特 征 值 中 有 任何 正 实数 
成 分 , 则 线性 微分 方程 系统 将 随 着 时 间 的 增加 时 指数 增长 (由 于 指数 因素 )。 所 
有 这 些 系统 都 被 认为 是 不 稳定 的 ,因为 这 些 系 统 缺乏 关于 均衡 点 的 收敛 特征 。 
如 果 所 有 的 特征 值 都 存在 负 实数 部 分 ,那么 系统 将 会 随时 间 的 增加 而 收敛 ,并 
保持 稳定 。 而 且 , 如 果 特 征 值 中 包括 虚数 部 分 ,这 个 系统 将 呈现 震荡 的 行为 。 
因此 ,包括 虚数 部 分 和 所 有 负 实 数 部 分 的 系统 将 会 有 螺旋 形 趋 近 均衡 点 的 轨 
迹 。 这 些 系 统 是 震荡 但 稳定 的 。 包 括 虚数 部 分 和 至 少 一 个 正 实 数 部 分 的 系统 
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注 :稳定 的 系统 要 求 特征 值 中 存在 负 实 数 部 分 , 即 复 平面 的 阴影 部 分 。 
图 6.7 包括 微分 方程 系统 的 特征 值 的 复 平面 (4 二 x 十 yi) 


将 从 均衡 点 螺旋 形 往外 运动 ,这 些 是 不 稳定 的 震荡 系统 。 当 至 少 一 个 特征 值 是 
虚数 , 且 剩 下 的 特征 值 的 实数 部 分 是 负数 时 ,出 现 的 是 中 性 均衡 , 即 围绕 均衡 点 
的 轨迹 。 从 上 面 的 讨论 可 以 看 出 ,如 果 所 有 的 特征 值 都 处 于 图 6. 7 的 左边 (阴影 
部 分 ), 则 线性 微分 方程 系统 的 均衡 点 附近 的 轨迹 都 是 稳定 的 。 读 者 应 该 注意 
到 , 当 我 们 讨论 非 线 性 系统 的 均衡 点 附近 的 稳定 性 标准 时 ,会 在 下 一 章 发 现 
图 6.7 的 用 处 。 


第 7 章 | 非 线性 微分 方程 系统 的 稳定 性 分 析 


第 6 章 关 于 一 阶 线性 微分 方程 系统 在 均衡 点 的 稳定 性 的 讨论 能 延伸 到 非 线 
性 方程 。 由 于 许多 社会 科学 模型 都 是 非 线性 的 ,所 以 这 点 也 非常 重要 。 实 际 
上 ,线性 模型 更 像 是 常规 中 的 例外 。 

求解 非 线性 微分 方程 系统 的 问题 是 ,方程 6. 12 的 系数 和 矩阵 A 在 非 线 性 方 
程 中 不 存在 。 然 而 , 若 意识 到 能 把 相位 空间 中 均衡 点 附近 的 非 线 性 模型 线性 
化 ,这 个 问题 就 能 很 容易 地 解决 。 也 就 是 说 , 当 我 们 检验 均衡 点 附近 的 非 线性 
系统 的 稳定 性 时 ,我 们 能 使 用 非 线性 系统 的 线性 部 分 来 得 到 这 个 区 域 的 非 线性 
系统 行为 的 精确 刻画 。 在 一 般 情 况 下 , 非 线性 系统 在 均衡 点 附近 和 线性 系统 中 
的 行为 非常 相似 。 虽 然 也 有 可 能 出 现 例外 ,但 这 样 的 例外 在 实际 中 很 少 遇 到 。 
这 意味 着 ,虽然 我 们 现在 处 理 非 线性 系统 ,但 我 们 持续 沿用 第 6 章 介绍 的 均衡 点 


AE HY be 


把 任何 非 线 性 微分 方程 系统 线性 化 的 关键 是 建立 系统 的 雅 可 比 和 矩阵 (简称 
为 “ 雅 可 比 ”)。 雅 可 比 是 方程 6. 12 的 系数 矩阵 A 的 等 价 线性 矩阵 。 虽然 大 部 
分 学 科 把 这 个 矩阵 称 为 “ 雅 可 比 和 矩阵 ”, 但 一 些 学 科 也 用 其 他 称谓 。 例 如 ,在 群 
体 生物 学 的 研究 中 , 雅 可 比 矩 阵 常 被 称 为 "群落 矩阵 "(May，1974)。 首 先 ,对 每 
个 方程 的 所 有 因 变 量 求 偏 导 数 , 然 后 把 因 变 量 的 均衡 值 代入 这 些 表达 式 中 ,从 
而 得 到 雅 可 比 和 矩阵 。 雅 可 比 和 矩阵 的 第 一 行 对 应 于 系统 的 第 一 个 方程 ,矩阵 的 第 
二 行 对 应 于 系统 的 第 二 个 方程 ,等 等 。 雅 可 比 和 矩阵 的 第 一 列 对 应 于 第 一 个 因 变 
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量 ,第 二 列 对 应 于 第 二 个 因 变 量 , 等 等 。 所 有 这 些 完 全 与 线性 系统 的 方程 6. 12 中 
系数 矩阵 A 的 结构 相 类 似 ( 实 际 上 ,线性 系统 的 雅 可 比 矩 阵 是 系数 矩阵 A). 
例如 ,两 个 因 变量 [f(zx,，y), g(x，y)j] 的 两 个 微分 方程 组 成 的 系统 的 雅 可 
比 矩 阵 是 : 
If", y*) Ifa", y`) 





Ox dy 
J= [7.1] 
dg(x*, y”) agla*, y") 
Ox dy 


RERE CTE FG EY AAE SHE TE JA ek ee PE SD OT a GO BT 
章节 描述 的 线性 系统 那样 。 也 就 是 说 , 雅 可 比 和 矩阵 的 特征 值 也 可 以 像 从 方程 
6. 12 的 系数 矩阵 中 求 得 特征 值 那样 求 得 。 一 且 求 得 特征 值 , 非 线性 系统 在 均衡 
点 附近 的 行为 就 可 以 根据 前 面 章节 讨论 的 线性 系统 的 6 类 均衡 稳定 性 来 分 类 
(如 非 稳定 的 节点 ,稳定 的 节点 、 鞍 点 、 不 稳定 的 螺旋 线 、 稳 定 的 螺旋 线 、 椭 圆 )。 
de 超 
出 这 个 区 域 ,就 应 该 使 用 前 面 章 节 介绍 的 数值 和 画图 方法 。 那 么 ,应 该 是 多 近 
的 距离 呢 ?” 这 依赖 于 当 轨 迹 远 离 均衡 点 时 , 非 线性 项 的 相对 影响 。 这 在 下 面 的 
讨论 中 将 具体 说 明 。 

在 这 一 点 上 ,我们 退 一 步 问 :为 什么 一 个 非 线性 系统 的 线性 化 等 价 项 能 用 
来 评价 均衡 点 的 稳定 特征 ,而 这 个 线性 化 的 项 离 均衡 点 较 远 的 时 候 却 不 能 呢 ? 
首先 ,我 们 引进 两 个 非 线性 微分 方程 : 


dx/dt = f(x, y) 
dy/dt = g(a, y) 


我 们 可 以 关注 在 这 个 均衡 点 附近 , (os yo ) 的 行为 怎样 。 然 后 通过 下 面 的 变换 
把 这 个 均衡 点 移 到 原点 : 
u= XL—X 2T 
z= y— y [73] 


现在 非常 明显 , 当 z 和 yy 在 均衡 点 附近 时 ,新 变量 会 接近 原点 (Blanchard et al. , 
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2006:458 一 460) 。 
根据 新 变量 x 和 ,我 们 能 把 系统 重 写成 下 面 的 方程 ,其 中 ,zs 和 > 是 
常数 ; 
du/dt = d(x—2x»)/dt = dx/dt = f(x, y) 


dz/dt = d(y— y)/dt = dy/dt = g(x, y) 
从 方程 7. 2 和 方程 7. 3 可 以 看 出 : 
du/dt = f(x +u, yo +z) 


dz/dt = g(a tu, y +z) 


在 原点 附近 ,u 和 > 接近 原点 ,在 均衡 点 时 ， 
du/dt = f(x, yo) =0 [7.4] 
dz/dt = g(xo, yo) =0 L7. 5] 


我 们 要 注意 ,一 旦 通过 变量 转换 把 均衡 点 移 到 原点 ,那么 在 均衡 点 附近 , 非 线 性 
项 比 线性 项 更 小 。 例 如 ,如 果 工 = 0.1, y=0.1, 那么 zy =0.01。 因 此 ,在 均衡 
点 附近 ,线性 项 主导 着 系统 。 对 于 任何 两 个 相互 依赖 函数 的 最 好 的 线性 近似 是 
正切 平面 。 这 个 正切 平面 和 函数 的 泰勒 多 项 式 近 似 的 线性 项 一 样 。 因 此 ,会 
得 到 : 


9 9 
U x faa, w+ | Lea, w) ut | Lz, yo) fe [7.6] 
t Ox dy 
dz dg dg 
gl m) + | E Caa av) jut | Eero» y) |e [7.7] 
t Ox dy 


请 注意 ,根据 方程 7. 4 和 方程 7. 5, 方 程 7. 6 和 方程 7. 7 右边 的 第 一 项 都 为 0。 
方程 7. 6 和 方程 7. 7 的 剩余 项 以 矩阵 形式 表示 ,得 到 : 

du /dt 
dz/dt 


u 


和 个 














z 


其 中 ,J 是 方程 7. 1 定义 的 雅 可 比 矩 阵 。 
请 注意 ,变量 x 和 > 的 变化 仅仅 表示 在 均衡 点 附近 的 非 线 性 项 消失 。 我 们 
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不 再 需要 变量 的 变化 来 评价 微分 方程 系统 的 稳定 性 , 仅 需 要 雅 可 比 矩 阵 ,而 雅 
可 比 矩 阵 仅仅 依赖 于 原始 变量 + 和 y。 

虽然 上 面包 括 变 量变 化 和 雅 可 比 矩 阵 的 讨论 都 对 应 于 布 兰 查 德 等 人 
(2006:458 一 460) 使 用 的 标识 和 重点 ,但 读者 应 该 注意 ,这 与 微分 方程 文献 的 传 
统 表示 方法 的 不 同 。 由 于 这 不 仅 符合 本 质 要 求 ,而 且 非 常 具有 一 般 性 ,所 以 我 
更 喜欢 上 面 的 表示 方法 。 然 而 ,读者 会 注意 到 ,更 常用 的 方法 是 模拟 均衡 点 附 
近 的 扰动 ,并 观察 这 些 扰动 是 衰减 还 是 加 剧 。 如 果 这 些 扰动 衰减 , 则 这 个 均衡 
点 是 稳定 的 ,这 是 因为 ,这 些 轨 迹 最 后 都 会 收敛 到 均衡 点 。 如 果 这 些 扰 动 加 剧 ， 
则 这 些 轨迹 从 均衡 值 往外 发 散 ,这 个 均衡 点 就 是 不 稳定 的 。 这 两 种 方式 都 使 用 
雅 可 比 矩 阵 。 这 种 方法 和 我 偏好 的 方法 的 主要 区 别 是 ,前 者 不 需 变量 有 所 变 
化 。 然 而 ,泰勒 级 数 在 均衡 点 附近 直接 近似 。 虽 然 这 在 数学 上 与 我 前 面 介绍 
的 内 容 相 类 似 ,但 失去 了 本 能 的 理解 , 即 为 什么 在 均衡 点 附近 , 非 线 性 项 很 小 
因而 可 以 忽略 。 当 把 均衡 点 转 到 原点 时 ,这 就 变 得 很 明显 。 从 生态 群体 的 视 
角 用 一 个 更 传统 的 方法 来 呈现 这 个 问题 的 讨论 能 在 梅 (1974:19 一 26) 的 文章 
中 找到 。 对 于 其 在 社会 科学 中 的 应 用 ,也 可 参见 赫 克 费 尔 特等 人 (1982:40 一 42) 
的 研究 。 

现在 ,我 们 从 本 章 的 角度 来 重新 考虑 非 线性 猎 食 模型 (方程 3. 1 和 方程 3. 2), 
用 图 3. 3 使 用 的 参数 值 , a = 1,b6=1,c=3,e=1,m=0,n=0, RHA 
以 看 到 ,这 些 参 数值 生成 了 围绕 系统 中 心 点 的 椭圆 轨迹 使 用 相位 图 ,其 均衡 点 
是 (1/3,，1)。 我 们 想 确认 使 用 系统 的 雅 可 比 矩 阵 的 分 析 , 这 个 系统 如 方程 7. 8 
和 方程 7. 9 所 示 : 








dX /dt = X — XY [7.8] 
dY/dt = 3XY —Y [7.9] 
PAB FE AT LEE 
1 一 人 —z" | he a | 
J= = 
3y%  3z*—1) l3 0 





其 中 ,z” 和 ”分别 表 示 均 衡 值 1/3 和 1。 
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现在 ,我 们 把 这 个 均衡 值 代入 雅 可 比 矩 阵 中 ,并 求 特征 值 : 


det 





O—A a 
3 O—A 


这 能 生成 特征 方程 洲 十 1 = 0 MA =+ V—-1. 因此 ,4 = 土 i 是 纯 虚 数 。 从 
关于 线性 系统 的 前 面 章节 的 结果 来 看 ,我 们 知道 ,这 个 系统 的 解 形成 了 围绕 中 
心 点 (1/3, 1) 的 椭圆 轨迹 。 使 用 这 种 方法 的 唯一 限制 是 ,关于 因 变 量 的 椭圆 轨 
迹 的 结论 仅仅 适用 于 位 于 均衡 点 附近 的 相位 空间 区 域 ,如 这 个 例子 所 示 , 有 时 
也 可 能 发 现 轨迹 行为 持续 远离 均衡 点 。 但 是 , 非 线性 模型 都 有 例外 , 这 就 要 用 
其 他 方法 来 确认 ,例如 方向 场 域 和 流动 场 域 。 


本 章 小 结 


本 章 把 微分 方程 的 讨论 延伸 到 非 线性 系统 的 分 析 。 许 多 有 趣 的 微分 方程 
的 应 用 都 有 非 线性 成 分 ,因此 把 我 们 的 能 力 局 限 在 线性 微分 方程 并 不 是 个 好 选 
择 。 对 于 非 线 性 的 情形 ,我们 致力 于 描述 在 均衡 点 附近 的 任何 给 定 系统 的 稳定 
性 ,这 是 更 完整 地 完成 系统 分 析 的 一 部 分 ,系统 分 析 也 用 其 他 方法 (如 本 书 前 面 
介绍 的 图 示 法 ) 来 评价 一 些 系统 的 更 全 面 特征 。 非 线性 系统 的 稳定 性 分 析 的 关 
键 是 雅 可 比 和 矩阵 。 雅 可 比 和 矩阵 能 把 在 均衡 点 附近 的 系统 线性 化 ,因此 能 基于 系 
统 特征 值 的 标准 化 稳定 检验 。 我 们 现在 转向 图 6. 7, 会 发 现 用 线性 方法 来 描述 
系统 的 稳定 性 是 一 样 适当 的 。 两 种 方法 的 区 别 在 于 ,这 些 非 线性 实例 是 位 于 图 
6.7 的 局 部 雅 可 比 矩 阵 的 特征 值 , 而 不 是 整个 线性 系统 的 特征 值 ,而 稳定 性 特征 
就 局 限 在 均衡 点 附近 的 非 线性 部 分 。 
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所 有 类 型 (混沌 或 其 他 方法 ) 的 周期 行为 都 与 人 的 行为 有 很 大 的 关系 。 我 
们 每 天 晚上 睡觉 ,每 天 早上 起 床 ,在 固定 时 间 吃 饭 ;我 们 在 固定 的 时 间 选 举 ;我 
们 每 10 年 进行 一 次 人 口 普查 ,收集 数据 ;我 们 根据 其 他 选举 和 社会 周期 来 执行 
人 口 调查 ;我 们 的 行为 甚至 随 季节 发 生变 化 , 即 每 个 夏天 游泳 ,每 个 冬天 滑雪 。 
一 般 情况 下 ,人 类 几乎 总 是 重复 性 地 活动 。 微 分 方程 和 差分 方程 都 是 分 析 许 多 
类 型 的 周期 行为 的 理想 模型 ,社会 科学 家 经 常 利 用 这 些 方程 ,将 会 大 有 收益 。 
许多 关于 人 类 活动 周期 的 研究 是 关于 微分 方程 应 用 的 前 沿 研究 的 一 个 实例 。 
无 论 如 何 , 这 也 不 完全 是 一 个 从 未 探索 过 的 研究 前 沿 。 这 也 是 为 什么 当 我 们 把 
微分 方程 应 用 到 科学 研究 时 ,会 非常 兴奋 的 原因 之 一 。 

本 书 仅仅 对 微分 方程 研究 进行 了 初步 介绍 。 微 分 方程 的 研究 中 还 有 很 多 
领域 没有 被 包括 在 本 书 范围 内 。 例 如 ,有 可 能 存在 这 样 的 动态 系统 ,它们 不 能 
用 前 面 章 节 介绍 的 图 示 法 (如 相位 图 、 方 向 场 域 图 、 向 量 场 域 图 等 等 ) 来 分 析 。 
并 不 是 说 这 些 方法 没有 用 ,而 是 说 需要 附加 的 工具 来 解决 更 复杂 情形 下 遇 到 的 
一 些 问题 。 当 周期 行为 没有 按 预期 那样 重复 时 ,这 种 情形 就 可 能 发 生 ,这 是 三 
维 或 更 多 维 的 混沌 微分 方程 系统 的 一 个 特征 (Brown，1995b)。 当 自 变 量 : 清晰 
地 包括 在 方程 中 时 ,这 也 发 生 在 许多 二 维 非 自 治 系统 中 。 在 非 自 治 情形 中 ,向 
量 场 域 (定义 为 微分 方程 ) 随 着 时 间 的 增加 而 改变 。 超 出 本 书 的 其 他 方法 (如 
Poincaré 地 图 ) 也 能 用 于 这 个 系统 的 分 析 。 

在 一 般 情况 下 ,许多 有 趣 的 微分 方程 系统 能 产生 混乱 的 结果 ,实际 上 ,混乱 
在 本 质 上 非常 正常 。 例 如 , 当 水 分 子 随 着 河流 流动 时 ,不 管控 制 这 些 运 动 的 物 
理 法 则 是 什么 ,都 不 可 能 基于 它们 在 上 游 的 位 置 来 预测 它们 最 终 在 下 游 的 精确 
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位 置 。 这 也 不 是 因为 我 们 没有 足够 的 信息 。 相 反 , 这 是 这 些 系统 的 一 个 特点 ， 
即 初始 条 件 表 面 的 细微 变化 能 使 得 系统 随时 间 变 化 而 产生 巨大 的 变化 。 此 外 ， 
我 在 其 他 地 方 也 有 相关 介绍 (Brown，1995b) ,这 也 是 想 进一步 研究 微分 方程 的 
学 生 下 一 步 学 习 的 一 个 方面 。 

在 数学 研究 的 许多 领域 ,大 学 本 科学 生 实际 上 很 少 能 遇 到 学 者 们 在 实际 研 
究 中 所 遇 到 的 数学 问题 。 为 了 看 到 真实 研究 是 什么 ,学 生 需 要 进一步 接受 关于 
数学 方法 的 研究 生 教育 。 但 微分 方程 的 研究 有 些 不 同 。 这 是 本 科 生 和 高 级 研 
究 人 员 都 会 在 这 个 领域 面临 的 相同 的 问题 ,这 也 是 为 什么 微分 方程 研究 这 么 盛 
行 的 原因 之 一 。 在 进行 至 少 一 项 前 沿 研究 前 ,没有 必要 继续 深入 研究 这 个 
问题 。 

如 果 微分 方程 的 研究 在 一 般 情况 下 是 真实 的 ,那么 ,微分 方程 在 社会 科学 
中 的 应 用 甚至 会 更 真实 ,这 一 点 非常 明显 。 虽 然 有 很 多 用 微分 方程 解决 重要 社 
会 科学 问题 的 例子 (这 些 本 书 均 有 介绍 ) ,但 我 们 现在 也 仅仅 是 接触 到 冰山 的 一 
角 。 对 于 社会 科学 家 ,未 探究 的 前 沿 研究 比 已 经 探索 的 领域 更 宽广 。 对 于 希望 
在 这 方面 继续 深入 研究 的 学 生 , 不 管 你 对 未 来 的 设想 是 线性 的 还 是 非 线 性 的 ， 
你 现在 都 处 在 学 习 的 正确 时 点 上 。 
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附录 1 


为 了 说 明 这 些 公 式 如 何在 实际 中 使 用 ,下 面 的 程序 (用 SAS 编写 ,很 容易 改 
成 其 他 语言 ) 介 绍 了 如 何 画 学 习 曲 线 。 很 重要 的 一 点 是 介绍 如 何 编程 ,因为 许 
多 社会 科学 家 发 现 ,他 们 不 可 避免 地 会 遇 到 需要 编写 他 们 自己 的 RK4 模型 的 情 
形 。 有 一 些 软件 包 自 身 包括 RK4 法 ,一 些 科学 家 发 现 ,这 些 软件 包 很 有 用 ,但 其 
他 科学 家 可 能 发 现 ,这 些 软件 包 在 处 理 特别 真实 的 情形 时 ,缺乏 足够 的 灵活 性 ， 
因此 有 必要 用 RK4 法 编写 自己 的 模型 。 最 明智 的 做 法 是 ,一 旦 用 RK4 法 编写 
了 一 个 模型 ,就 可 以 把 这 些 程序 剪 切 并 粘贴 到 其 他 程序 中 。 记 住 , 只 需要 做 小 
小 的 改动 (如 步 长 ,初始 条 件 、 参 数值 ) ,同样 的 编码 几乎 适用 于 所 有 微分 方程 。 

对 于 下 面 的 编码 ,大 写 仅仅 是 一 种 体例 ,是 否 大 写 不 影响 程序 的 运行 。 下 
面 有 两 个 子 程序 :RK4 和 EQS。BUILDIT 是 子 程序 RK4 和 EQS 下 面 的 标签 ， 
RK4 子 程序 在 那里 调用 。EQS 子 程序 在 RK4 子 程序 下 调用 , 它 下 面 即 微分 方 
程 模型 。 

GOPTIONS lfactor = 10 hsize=6 in vsize=6 in horigin=1 in vorigin=3 in; 

TITLE f = swissb h= 1. 6 c=black 'Figure 2.3: A Learning Curve '; 

PROC IML; 

a= 3.0; x 模型 的 参数 值 ; 

Y= 0.1; U=1.6;xY 的 初始 条 件 和 上 限 U; 

H= 0.02; tine=0;x 步 长 hn 和 时 间 的 初始 值 ; 
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START; 


GOTO BUILDIT; 


RK4. 

x 四 次 Runge-Kutta 法 ，; 

time=0; 

DO LOOP = 1 to 100; 

ml =Y,; x RK4 第 一 步 是 把 因 变量 的 初始 值 设 为 Y; 

LINK EQS; x 把 方程 的 子 程序 连接 到 RK4 的 第 一 步 ; 

RK1 = DYDT, x 完成 RK4 第 一 步 ; 

ml = 了 + (.5 间 h#RK1); x 现在 给 出 用 在 RK4 第 二 步 的 ml 第 二 个 值 ; 
LINK EQS; x 把 方程 子 程序 连接 到 RK4 的 第 二 步 ; 

RK2 = DYDT; x 完成 RK4 第 二 步 ; 

ml = 了 + (.5#h#RK2); x 现在 给 出 用 在 RK4 第 三 步 的 ml 第 三 个 值 ; 
LINK EQS; x 把 方程 子 程序 连接 到 RK4 的 第 三 步 ; 

RK3 = DYDT; x 完成 RK4 第 三 步 ， 

ml =Y+h#RK3; x 现在 给 出 用 在 RK4 最 后 一 步 的 ml 第 四 个 值 ; 
LINK EQS, x 把 方程 子 程序 连接 到 RK4 的 最 后 一 步 ; 

RK4DYDT; x 完成 RK4 最 后 一 步 (或 第 四 步 ) ; 


YNEXT = Y + ( (h/6) # (RK1 + (2 井 RK2) + (2#RK3) + RK4) ) ; * 这 是 RK4; 
timenext = time + h; 

YE = YE//Y; TE = TE// time; x 以 向 量 形式 保存 Y 和 了 T 值 ; 

Trajects = YE || TE. 


Y = YNEXT; time = timenext. 
end; x 循环 结束 ; 
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RETURN ; 


x 使 用 不 同 的 Y 值 作为 RK4 四 步 的 ml 值得 到 的 学 习 曲 线 模型 ; 


EQS; 

DYDT = aff (Uml); x 这 是 模型 ， 

RETURN; 

BUILDIT: 

LINK RK4. 

party={'Y''Time'}; 

create traject from trajects(|colname = party| ) ; 
append from trajects; 

close trajects; 


finish; run; 


data traject; set traject; * HA; 

sym=1, 

Symboll color = black v= none f = simplex i= join; 

proc gplot data = traject; 

axisl color = black minor = none order = 0 to 2 by. 2 minor = none 
value = (h=1.5 f = swissb c = black) 

label = (a= 90 r=0 h=2 f= swissb c=black 'Dependent Variable '), 
axis2 color = black minor = none order = 0 to 2 by. 25 minor = none 
value = (h=1.5 f= swissb c= black) 

label = (h= 2 f = swissb c = balck 'Time '). 

plot Y x time = sym/skipmiss nolegend 


vaxis = axisl haxis = axis2 vminor = 0 hminor = 0 vref = 1.6; 
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附录 2 


下 面 是 用 RK4 法 求解 两 个 方程 的 系统 的 SAS 程序 。 读 者 应 该 能 发 现 ,把 
其 中 的 单个 微分 方程 的 程序 扩展 到 下 面 的 微分 方程 系统 是 件 很 容易 的 事 。 图 
3. 2 就 是 用 这 个 程序 画 出 来 的 。 最 后 ,我 也 介绍 了 如 何 稍微 改动 这 个 程序 ,就 能 
画 出 如 图 3. 4 这 样 的 相位 图 。 附 录 的 说 明 有 助 于 理解 RK4 法 的 计算 过 程 。 

GOPTIONS lfactor = 10 hsize = 6 in vsize=6 in horigin=1 in vorigin=3 in; 

TITLE f = swiss h= 1.6 c=black 'Figure 3. 2; The Predator-Prey Model '. 


PROC IML; 


a=1, b=1, c=3, e=1. m=1.5,; n=0.5; 


tad, F2 
h=0.1; time = 0; x 步 长 h 和 时 间 的 初始 值 ; 
start; 


goto buildit, 


RK4 

x 四 次 Runge-Kutta; 

time = 0, 

do LOOP = 1 to 125, 

xl = X; x2=Y;, 

LINK EQS; 

RK1 = DXDT; CK1 = DYDT; 

xl =X+(.5#h#RK1); x2=Y+ (.5#h#CK1); 


LINK EQS; 
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RK2 = DXDT; CK2 = DYDT. 
x1=X+(.5htRK2); x2=Y+ (.5#h#CK2); 
LINK EQS; 

RK3 = DXDT; CK3 = DYDT; 

xl =X+ (h#RK3); x2=Y+ (h#CK3); 

LINK EQS; 

RK4 = DXDT; CK4 = DYDT; 


XNEXT = X + ((h/6) # (RK1 + (24+RK2) + (24¢ RK3) + RK4) ) ; 
YNEXT = Y + ( (h/6) # (CK1 + (2#CK2) + (24CK3) + CK4) ) ; 


timenext = time + h; 


YE = YE//Y; XE = XE//X; TE=TE//time; 
trajects = XE || (YE || TE) ; 

Y = YNEXT, X= XNEXT; time = timenext, 
end, 


RETURN; 


* 猎 食 模型 

EQS: 

DXDT = (a— bttx2-mt x1) # x1; 
DYDT = (c 间 x1 - e- n# x2) # x2, 


RETURN; 
BUILDIT: 


LINK RK4. 


party = {'X''y''Time'}, 
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create traject from trajects (|colname = party| ) ; 
append from trajects; 
close traject, 


funish; run, 


data traject; set traject, 
sym=1. 
if t=0 then sym=3 
label Y = 'Predator and Prey Populations '; 
label t = 'Time '; 
Symboll color = black v= NONE f = centb i= join, 
symbol2 color = black f = centbv = symboll color = black v='.'; 
proc gplot data = traject, 
axis1 color = black minor = none 
value = (h=1.5 f= swissb c= black) 
label = (h=1.3 a=90 r=0 f= swissb c=black), 
axis2 color = black minor = none 
value = (h=1.5 f= swissb c= black) 
label = (h= 1.3 f = swissb c = black) ; 
plot Y * Time X x Time/overlay nolegend skipmiss 
vaxis = axisl haxis = axis2 vminor = 0 hminor= 0; 
run; 
quit; 
修改 这 个 程序 就 能 得 到 如 图 3. 4 所 示 的 相位 图 ,只 需 修 改 上 面 命令 的 后 半 
部 分 。 例 如 ,要 得 到 图 3. 4, 就 用 以 下 命令 代替 上 面 程序 的 后 半 部 分 : 


data traject; set traject; 


sym=1. 
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if t= 0 then syn=3; 


label Y = 'Predator Population '; 


label X = 'Prey Population '; 


label t= 'Time'; 
Symboll color = black v = NONE f = centb i= join; 
symbol2 color = black f = centb v='.': 
proc gplot data = traject; 

axisl color = black minor = none 

value = (h=1.5 f= swissb c= black) 

label = (h=1.3 a=90 r=0 f= swissb c=black). 
axis2 color = black minor = none 

value = (h=1.5 f= swissb c= black) 

label = (h=1.3 f = swissb c= black); 

plot Y* X/nolegend skipmiss 


vaxis = axisl haxis = axis2 vminor = 0 hminor = 0; 


quit; 
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。 ”译名 对 照 表 


analytical solutions to linear first-order 一 阶 线性 微分 方程 的 分 析 解 
differential equations 
army losses 军队 损耗 
autonomous differential equations 自治 微分 方程 
catastrophe theory 灾难 理论 
chaos theory 混沌 理论 
closed systems 封闭 系统 
coefficient matrix 系数 矩阵 
correlational analysis 相关 分 析 
cross-tabulation tables 交叉 表 
deterministic differential equation models 确定 性 微分 方程 模型 
direction field diagrams 方向 场 域 图 
elliptical trajectories 椭圆 轨迹 
equilibria 均衡 
equilibrium marsh 均衡 域 
equivalent expressions 等 价 表达 式 
Euler method Euler 法 
exponential Decay 指数 衰减 
exponential growth 指数 增长 
field diagrams 场 域 图 
first-order differential equations 一 阶 微分 方程 
flow diagrams 流程 图 
fourth-order Runge-Kutta method 四 次 Runge-Kutta 法 
hlobal warming modeling 全 球 变 暖 模型 
goods production and exchange model 商品 生产 交易 模型 
guess and test method 猜测 检验 法 
Heun’s method Heun 法 
higher-order differential equations 更 高 阶 微分 方程 
imaginary components 虚数 部 分 
improved Euler method 改进 的 Euler 法 
initial-value problems 初始 值 问题 
Jacobian matrix FER HEHE RE 
Lanchester’s combat models 兰 彻 斯 特 战斗 模型 
learning curves 学 习 曲 线 


linear first-order differential equations 


一 阶 线性 微分 方程 


linear second-order differential equations 

logistic curves model 

matrix methods 

negative feedback 

neutral stability 

nodes 

nonautonomous differential equations 

nonlinear first-order differential equations 

numerical methods 

Ordinary Least Squares(OLS) Regression 

parameter estimation 

partial differential equations 

partisan competition model 

phase diagrams 

phaser computer program Phaser 

pollution modeling 

predator-prey model 

principle of superposition 

probabilistic differential equation models 

Rapoport’s production and exchange model 

Richardson’s arms race model 

RK4 method 

Runge-Kutta methods 

saddle points 

SAS computer program 

scalar methods 

second-order differential equations 

separation of variables solution 

sequential dynamics 

sink equilibrium 

stability analyses of linear differential 
equation systems 

stable nodes 

stable spirals 

stochastic models 


straight-line solutions 
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二 阶 线性 微分 方程 
logistic 曲线 模型 
矩阵 法 

RRR 

中 立 均衡 

节点 

非 自 治 微分 方程 

一 阶 非 线性 微分 方程 
数值 法 
最 小 二 乘 回归 

参数 估计 

偏 微分 方程 

党 派 竞争 模型 
相位 图 

计算 机 程序 

污染 模型 

猎 食 者 一 猎物 模型 
Re 
概率 性 微分 方程 模型 
拉 波 波 特 生产 交易 模型 
理 查 森 军事 竞赛 模型 
RK4 法 

Runge-Kutta 法 

鞍点 

SAS 计算 机 程序 
标量 法 

二 阶 微分 方程 
分 离 变量 解 

序列 动态 

沉 点 均衡 

线性 微分 方程 系统 的 稳定 性 分 析 


稳定 节点 
稳定 螺旋 线 
随机 模型 
直线 解 
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Taylor series approximation 泰勒 多 项 式 近 似 
time series plots 时 间 序 列 图 
unstable nodes 不 稳定 节点 
unstable spirals 不 稳定 螺旋 线 
utility levels 效应 水 平 


vector field diagrams 向 量 场 域 
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SEALER EE a eS 


比较 既是 科学 的 根本 法 则 ,又 是 日 常生 活 的 基本 要 素 。 它 是 一 个 自发 的 心 
智 过程 , 所 以 ,“ 没 有 比较 ,不 成 思考 ”(Swanson, 1971:145) 。 我 们 常常 在 进行 比 
较 :商店 里 的 强 子 是 长 还 是 短 , 明 天 的 天 气 是 好 还 是 坏 ,衣服 的 尺码 是 大 了 还 是 
小 了 ,列车 到 达 是 早 还 是 晚 , 诸 如 此 类 。 简 单 的 “人 口 密 集 ” 这 个 词 就 已 经 隐 含 
了 比较 (Smelser, 1976:3) 。 在 社会 科学 中 ,研究 者 比较 不 同城 市 的 生活 质量 、 
不 同 国家 的 政府 稳定 性 .不同 社会 群体 的 经 济 行为 ,还 有 仪式 对 社会 凝聚 力 的 
影响 等 。 与 “分 类 ”一 起 (Bailey，1994) , 比较 是 理解 世界 的 关键 概念 化 过 程 
a, 


对 象 、 属 性 与 取 值 


“比较 ?最 简单 的 定义 如 下 :比较 是 两 个 及 两 个 以 上 的 对 象 或 个 案 ( 观 察 单 
位 ) 的 属性 (特性 ) 之 取 值 (差异 单位 ) 的 并 置 。 例 如 ,民主 化 (属性 ) 在 英国 (对 象 ) 
较 早 完成 ( 取 值 ) ,而 在 俄国 则 被 延误 了 。 

若 我 们 比较 不 同时 期 的 同一 对 象 , 这 一 定义 同样 适用 。 意 大 利 的 选举 变动 
ZRODE 1948 年 和 1983 年 分 别 是 23. 0 和 8. 3。 这 里 的 比较 对 象 是 不 同年 份 的 选 
举 。 也 就 是 说 ,比较 关注 的 是 变异 :一 个 变量 在 不 同 个 案 之 间 取 值 的 差异 。 

首先 ,比较 意味 着 描述 变量 。 与 解释 和 预测 一 样 ,描述 是 科学 活动 的 主要 


”选举 变动 率 有 多 个 含义 ,最 常见 是 两 次 选举 中 变换 自己 所 支持 党 派 的 选民 的 比例 。 感 兴趣 
的 读者 可 参见 http: //www. answers. com/topic/electoral-volatility。 一 一 译 者 注 
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任务 之 一 。 描 述 性 比较 关注 两 个 及 两 个 以 上 个 案 的 相似 与 相 异 程度 。 描 述 性 
比较 可 以 是 以 下 几 种 :(1) 名 义 的 (或 定 类 的 ) 一 一 属性 存在 与 否 以 及 属性 的 不 
同类 别 ( 例 如 ,瑞士 的 选举 系统 是 比例 代表 制 , 而 英国 的 则 是 多 数 制 )D;(2) 定 序 
的 一 一 比较 多 或 少 ,比较 时 间 的 早 或 晚 、 快 或 慢 ( 例 如 ,英国 的 国家 形成 比 瑞士 
更 早 );(3) 定 量 的 ( 定 距 的 或 者 比例 的 ) ,变量 取 值 是 连续 且 可 量化 的 (例如 ,瑞士 
有 效 党 派 的 数量 比 英 国 多 2. 92 个 )。 


比较 法 作为 一 种 方法 


存在 于 所 有 人 类 行为 中 的 描述 性 比较 ,其 内 在 特性 导致 了 第 一 个 问题 :如 
果 比 较 是 普遍 存在 的 心智 过 程 ( 从 日 常生 活 到 科学 研究 ) , 那 为 何 我 们 还 要 把 它 
称 为 比较 “方法 ”? 我 的 回答 是 ,比较 方法 比 起 自然 的 心智 活动 ,还 要 多 一 点 : 它 
是 一 种 分 析 现 象 及 其 因果 关联 的 方法 , 即 通 过 “如 果 …… 那 么 ……” 形 式 的 陈 
述 , 利 用 经 验证 据 检验 因果 关联 的 不 同 假设 。 比 较 法 不 仅 是 不 可 或 缺 的 认 知 与 
描述 工具 ,更 是 解释 性 的 ,是 一 项 控制 变异 的 方法 (Smelser，1976:152) 及 建立 
变量 间 普 遍 性 关系 或 “法 则 ”的 方法 (Lijphart, 1971:683; Sartori, 1970:1035), 
最 终 , 它 是 一 项 归纳 推理 的 方法 。 

因此 ,进行 比较 并 不 只 是 描述 变异 。 要 进行 解释 ,必须 有 变异 。 没 有 变异 
(不 同 个 案 之 间 的 分 数 或 取 值 的 差别 ) ,就 不 可 能 进行 解释 。 这 一 点 适用 于 所 有 
类 型 的 比较 ,无 论 是 基于 大 样本 、 通 过 统计 (定量 的 ) 技 术 进 行 的 大 规模 比较 研 
究 , 还 是 基于 少数 个 案 、 通 过 逻辑 与 布尔 代数 进行 的 小 规模 比较 研究 。 尽 管 “ 比 
较 法 ”日 益 等 同 于 第 二 种 方法 (小 样本 ), 但 根本 原则 是 一 致 的 。 事实 上 ,大 部 分 
比较 方法 的 实践 者 都 同意 , “定量 的 "和 “定性 的 ”技术 存在 一 些 基 本 共同 点 .1 

相应 的 ,我 们 可 以 这 么 定义 比较 方法 : 它 是 一 组 利用 经 验证 据 , 系统 地 检验 
现象 之 间 因果 关系 备 择 ( 或 竞争 性 ) 假 设 的 逻辑 程序 ,要 么 确证 ,要 么 拒绝 它们 。 





比例 代表 制 以 每 一 参 选 组 所 得 选票 占 全 部 票数 目的 百分比 分 配 议 席 . 而 多 数 制 的 原则 是 “ 胜 
者 全 取 ”, 即 该 选区 得 票 多 的 党 派 获取 该 选区 全 部 议席 。 一 一 详 者 注 
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比较 方法 的 目标 是 发 现 类 似 于 规律 的 “因果 律 ”(Skocpol，1984a: 374 一 386)。 
当然 ,这 一 分 析 路 径 并 不 是 执行 比较 研究 的 唯一 方法 (Peters，1998:9 一 11)。 比 
较 研 究 者 还 运用 其 他 方法 ,比如 因果 诠释 ,但 这 些 并 非 控制 方法 ,因为 它们 没有 
利用 经 验证 据 来 检验 因果 关系 假设 (Skocpol，1984a:372) 。 


比较 法 与 其 他 方法 


在 此 必须 指出 ,上 文 的 比较 法 定义 涵盖 了 一 些 其 他 方法 。 它 同样 适用 于 实 
验 和 统计 方法 ,而 并 不 局 限于 近年 来 通常 认为 的 狭义 比较 法 , 即 基 于 密 尔 法 和 
布尔 代数 的 比较 法 。 

这 导致 了 第 二 个 问题 。 如 果 说 比较 法 与 其 他 方法 同样 具有 分 析 性 特征 ,并 
且 “ 比 较 ? 这 一 术语 的 确 被 涂 尔 干 (Durkheim) 和 帕 森 斯 (Parsons) 应 用 到 实验 法 
和 统计 法 当中 ,那么 ,比较 法 和 其 他 方法 的 区 别 何在 ? 比较 法 的 特殊 性 在 哪里 ? 

有 些 学 者 依然 认为 ,没有 比较 就 没有 科学 思想 (Swanson，1971:145), 且 无 
论 何 种 形态 的 研究 ,都 不 可 避免 是 比较 性 的 (Lasswell，1968: 3; Lieberson, 
1985:44)。 阿 尔 蒙 德 提出 :如果 说 比较 法 是 一 种 科学 的 话 , 那 就 没 必要 在 政治 
学 中 强调 比较 法 ,因为 不 言 而 喻 , 它 就 是 比较 的 .”(Almond，1966:877 一 878) 由 
于 比较 构成 了 所 有 科学 解释 的 核心 (Armer，1973; Bailey, 1982; Blalock, 
1961; Nagel, 1961), 有 些 学 者 反对 比较 法 在 逻辑 和 认识 论 方面 的 独特 性 
(Grimshaw,，1973:18)。 如 克 林 曼 (Klingman,，1980:124) 所 言 ,许多 争论 忘记 了 
所 有 科学 本 质 上 都 是 比较 的 。 作 为 认识 论 根 本 原则 的 控制 与 确证 因果 关系 , 存 
在 于 所 有 社会 科学 经 验 研究 方法 中 。 这 一 观点 坚持 认为 ,不 同方 法 之 间 存 在 根 
本 上 的 连续 性 。 实 验 法 之 所 以 特殊 ,是 因为 它 设法 操控 了 变量 [2] , 而 统计 方法 
和 比较 方法 之 间 “ 并 无 明确 的 分 界线 ”(Lijphart，1975: 159 一 160)。 斯 梅 尔 塞 
CSmelser，1976) 认 为 ,比较 方法 是 统计 方法 的 一 个 近似 物 。 弗 兰 德 斯 (Frendreis， 
1983) 强 调 , 所 有 方法 都 基于 共 变 。“ 比 较 研 究 ” 一 一 跨国 分 析 一 一 经 常 基于 统计 
学 ,所 以 比较 的 视角 或 策略 并 不 预 设 独 特 的 比较 方法 (Benjamin，1977; 
Lijphart, 1975; Pennings, Keman & Kleinnijenhuis, 2007). 

比较 研究 往往 依赖 统计 研究 设计 ,有 大 量 个 案 和 定量 的 变量 。 在 这 广义 的 
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定义 方面 ,比较 方法 只 不 过 是 把 统计 方法 应 用 到 跨国 研究 设计 中 而 已 。 

事实 上 ,比较 法 的 某 些 特殊 性 存在 于 其 独特 的 研究 目的 中 :“ 比 较 研 究 者 对 
辨识 宏观 社会 单位 的 共性 与 差异 感 兴趣 。”(Ragin，1987:6) 其 独特 方面 包括 国 
家 、 社 会 与 文明 之 间 的 分 析 比 较 。 在 过 去 ,“ 比 较 政 治学 ”( 尤 其 在 美国 ) 曾 经 专 指 
关于 其 他 国家 的 研究 。 时 至 今日 ,比较 经 常 被 认为 是 以 下 两 个 词 的 同义词 : (1) 
跨国 研究 ; (2) 把 宏观 社会 层次 变量 当做 个 体 层次 研究 设计 的 控制 变量 (Prze- 
worski & Teune, 1970) 。 长 期 以 来 ,比较 都 被 简单 地 等 同 于 有 社会 层面 的 属性 
出 现在 解释 性 的 陈述 中 。 这 一 特殊 研究 目的 设 定 了 比较 法 的 大 框架 , 即 利用 一 
系列 方法 进行 跨 社会 分 析 (Easthope,1974) 。 

与 此 “实践 性 ”的 定义 不 同 , 另 一 定义 方法 指向 以 宏观 社会 单位 为 个 案 进行 
研究 所 引发 的 方法 论 后 果 。 它 强调 ,比较 法 适用 于 回答 涉及 个 案 数目 少 ( 小 样 
本 问题 ) 的 研究 问题 。 除 了 更 具 方 法 论 意蕴 ,这 种 定义 还 具有 使 研究 不 局 限 在 
跨 社会 研究 设计 内 的 优势 。 比 较 法 可 被 应 用 于 不 同 分 析 单 位 ,除了 地 域 单位 ， 
还 可 以 是 各 种 组 织 ( 比 如 ,工会 .党 派 ,社会 运动 ) 和 个 体 。 然 而 ,这 一 定义 并 未 划 
出 一 条 区 别 于 其 他 方法 的 清晰 界线 (除了 样本 数量 ) 。 

那么 ,到 底 是 否 存在 独特 的 比较 法 呢 ?” 如 果 所 有 方法 “除了 样本 大 小 ”外 
(Lijphart, 1971:684) , 均 共 享 主 要 原则 且 都 很 相似 , 那 为 何 还 要 谈论 比较 法 ? 
近年 来 ,比较 法 的 3 个 独特 性 得 到 了 强调 :首先 , 它 依赖 密 尔 三 准则 (Mill's first 
three canons) , 即 求 同 法 、 求 异 法 、 求 同 求 异 并 用 法 以 及 布尔 代数 来 处 理 “ 性 质 ” 
而 非 “ 程 度 ”( 数 量 ) (顺便 说 一 句 , 这 点 应 能 帮助 我 们 区 分 “比较 的 ”和 “ 质 性 的 ”这 
两 个 常 被 混淆 的 术语 )。 其 次 , 它 基 于 必要 与 充分 条 件 来 判断 因果 关系 。 最 后 ， 
其 解释 模型 本 质 上 是 组 合 的 或 构 型 的 中。 


比较 法 与 统计 学 


根据 以 上 这 些 独 特 方面 ,比较 方法 与 统计 学 区 别 开 来 。 通 过 这 种 分 离 , 比 





中 构 型 (configuration) 在 有 机 化 学 中 , 特 指 一 个 有 机 分 子 中 各 个 原子 特有 的 、 固 定 的 空间 排列 。 
而 在 本 文 的 语 境 中 , 指 的 是 不 同 条 件 的 各 种 搭配 方式 。 一 一 译 者 注 
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较 方 法 已 不 仅 是 把 统计 学 应 用 于 跨国 研究 ,而 是 一 种 不 同 于 统计 学 的 方法 。 近 
年 来 ,这 一 方法 被 识别 与 标注 为 “比较 法 ”。 很 明显 ,在 比较 研究 领域 ,统计 学 依 
然 在 大 样本 研究 设计 中 得 到 了 广泛 运用 。 然 而 , 另 一 个 方法 (比较 法 ) 已 经 发 展 
起 来 : 它 使 用 不 同 的 技术 ( 密 尔 三 法 与 布尔 代数 ) ,对 因果 关系 有 不 同 的 理解 ( 基 
于 必要 与 充分 条 件 ) ,并 且 强 调 自 变量 之 间 的 联合 性 或 者 构造 性 关系 (区 别 于 纯 
粹 的 县 加 性 关系 )。 

实际 上 ,这 一 新 的 比较 法 与 统计 学 的 共同 点 比 它 假定 的 要 和 多。 首先 ,统计 
技术 也 可 以 处 理 定性 的 ,分 类 的 、 离 散 的 ,虚拟 变量 和 二 分 变量 数据 (不 光 是 列 
联 表 , 更 重要 的 是 , 它 在 对 数 线性 分 析 、logistic 回归 和 probit 模型 中 都 可 以 进行 
分 析 , 这 些 都 在 其 他 书 中 有 专门 论述 ,参见 Aldrich & Nelson, 1984; DeMaris, 
1992; Hardy, 1993; Ishii-Kuntz, 1994; Kant Borooah, 2001; Knoke & 
Burke, 1980; Liao, 1994; Menard, 2001; Pampel，2000) 。 其 次 ,许多 统计 技 
术 同 样 能 够 处 理 联合 型 与 构造 型 解释 模型 (可 以 利用 交互 作用 ,在 列 联 表 中 最 
明显 ,在 回归 中 亦 有 体现 ,参见 Jaccard & Wan，1996; Jaccard & Turrisi， 
2003). 

这 也 意味 着 , 常 被 人 相提并论 的 “定性 的 ”与 “定量 的 ”技术 在 根本 原则 上 ， 
并 无 多 大 差别 。 本 书 关注 近年 来 人 们 常 说 的 “ 那 种 ”比较 法 ,强调 了 狭义 比较 法 
的 优势 与 特殊 性 , 即 它 处 理 有 限 个 案 及 区 分 必要 和 充分 条 件 的 能 力 。 本 书 集中 
关注 这 种 狭义 比较 法 的 特殊 性 ,而 非 那 种 广义 比较 法 (基于 统计 分 析 的 大 规模 
跨国 比较 的 比较 策略 )。 然 而 , 整 本 书 依然 会 以 大 规模 统计 技术 作为 参考 ,以 期 
强调 比较 法 与 统计 法 的 共同 点 以 及 统计 法 在 哪些 方面 与 跨国 比较 相关 。 既 然 
如 此 ,让 我 们 首先 回顾 一 下 比较 法 的 起 源 。 





第 2 和 草 | 历史 
比较 法 的 逻辑 起 源 


既然 比较 强调 统计 法 和 比较 法 的 共同 点 与 共同 根源 ,那么 回顾 比较 在 社会 
科学 中 的 角色 就 非常 重要 。 对 比较 的 反思 与 比较 在 科学 研究 逻辑 中 的 角色 紧 
密 相 关 。 比 较 的 历史 在 一 段 时 期 内 ,与 科学 和 逮 辑 是 重合 的 。 

在 关于 比较 的 争论 中 ,有 两 种 主要 观点 。 首 先 ,在 笛 卡 尔 哲学 的 角度 看 来 ， 
如 果 说 某 物 是 多 或 少 . 好 或 坏 ,比较 就 成 立 了 。 重 点 在 于 连续 性 的 数量 和 程度 。 
第 二 ,在 洛克 传统 中 ,重点 是 离散 属性 的 存在 或 缺失 。 在 17 世纪 ,德国 统计 学 派 
发 展 的 这 种 统计 学 的 “定性 "含义, 如今 会 被 归 入 “比较 法 ”中 。 只 有 黑 格 尔 在 其 
晚期 统一 了 这 两 种 含义 ,由 此 ,属性 的 存在 与 缺失 成 为 连续 体 的 两 个 极限 值 。 

对 19 世纪 的 实证 思想 家 而 言 ,比较 意味 着 基于 实验 研究 设计 来 建立 因果 关 
A AIR + MIR John Herschel) Æ K AHF Wie) (Preliminary Dis- 
course on the Study of Natural Philosophy) 一 书 中 ,提供 了 第 一 准则 ,但 只 
密 尔 的 《逻辑 系统 》(A System of Logic) 才 提出 了 最 著名 的 建立 因果 关系 之 
“准则 ”。 

求 同 法 是 指 当 某 现象 发 生 时 ,其 他 条 件 都 可 能 成 立 ,也 可 能 不 成 立 (不同 个 
案 的 情况 不 同 ) ,而 只 有 一 个 条 件 总 是 出 现 ( 所 有 个 案 的 情况 都 相同 ) , 那 就 可 推 
断 这 个 (总 出 现 的 ) 条 件 是 现象 发 生 的 原因 。 求 异 法 是 指 , 当 现 象 发 生 时 ,只 有 
这 一 个 条 件 成 立 , 而 当 这 一 条 件 不 成 立时 ,现象 就 不 发 生 。 求 同 求 异 并 用 法 结 
合 了 这 两 种 方法 .[34 而 共 变法 是 指 , 若 某 条 件 随 某 给 定 现象 的 变化 按 相应 比例 
变化 ,那么 推测 两 者 存在 因果 关系 。 
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密 尔 确信 他 的 方法 不 能 被 应 用 于 社会 科学 (生物 学 也 不 行 ), 因 为 研究 者 不 
能 控制 所 有 变量 并 分 离 出 原因 。 然 而 在 生物 学 中 ,达尔 文 表明 密 尔 法 非常 有 
用 , 且 不 需 控制 所 有 变量 。 

在 社会 学 中 , 涂 尔 干 认 为 , 共 变 法 (他 称 之 为 “比较 的 ”) 是 唯一 不 需 控 制 所 
有 变量 的 方法 。 这 一 观点 是 错误 的 (因为 这 一 方法 同样 要 求 控制 ,以 排除 虚假 
相关 ) ,但 这 无 疑 推进 了 定量 比较 方法 的 发 展 。 

涂 尔 干 抛弃 了 离散 逻辑 , 他 更 倾向 于 定量 的 测度 。 一 些 学 者 ,如 内 格 尔 
(Nagel，1950) 和 拉 扎 斯 菲尔德 (Lazarsfeld，1955; Blalock & Blalock, 1968), 
为 社会 科学 提出 了 一 个 新 方法 ,宣称 定性 的 测度 应 被 转化 为 虚拟 变量 (以 0 和 1 为 
HUH) (Hempel & Oppenheim, 1948; Lazarsfeld, 1937; Lazarsfeld & Barton, 
1951)。 这 一 方法 取向 舍弃 了 使 其 局 限于 定性 测度 的 “比较 ”这 一 术语 。 由 此 , 直 
到 20 世纪 60 年 代 ， 比 较 的 “与 “统计 的 ?方法 才 正式 分 道 扬 镰 。 

然而 ,尽管 自 20 世纪 六 七 十 年 代 以 来 ,这 种 区 别 逐 渐 被 接受 (Lijphart， 
1971; Smelser，1966) ,但 模糊 地 带 依然 存在 。 不 过 最 重要 的 可 能 是 ,所 有 方法 
都 基于 密 尔 准 则 .上 而 在 密 尔 自 己 的 体系 中 ,最 终 ,所 有 方法 都 归于 求 异 法 
(Mill，1875:464 一 466) 。[5] 


比较 法 在 早期 社会 科学 中 的 应 用 


以 上 这 些 “ 比较” 的 不 同 含义 及 其 共同 点 ,都 出 现在 早期 社会 研究 中 。 比 
如 ,斯 梅 尔 塞 所 著 (Smelser, 1976:4) 关 于 托 克 维尔 (Tocqueville) 的 书 以 及 涂 尔 
干 和 韦伯 (Weber) 对 不 同类 型 比较 研究 的 强调 。 在 斯 梅 尔 塞 和 韦伯 那里 ,存在 
一 个 独特 的 比较 法 ;而 在 涂 尔 干 那里 ,比较 法 等 同 于 统计 学 。 

密 尔 在 其 1840 年 对 《美国 的 民主 ) 一 书 所 作 的 评论 中 提出 , 托 克 维尔 是 第 一 
个 系统 地 利用 其 方法 的 学 者 。 托 克 维 尔 的 策略 之 一 是 辨识 两 个 国家 的 两 组 特 
征 ,并 认为 一 组 特征 中 的 差异 可 由 男 一 组 特征 中 的 差异 来 解释 。 例 如 ,在 英国 ， 
社会 阶级 之 间 的 隔 疼 比 法 国 小 ,从 而 减少 了 群体 间 冲 突 。 而 有 时 ,他 则 通过 比 
较 同一 个 案 在 不 同时 期 的 取 值 ,或 增加 第 三 个 个 案 来 强化 解释 力度 (Smelser， 
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1976:22 一 30) 。 这 些 策略 都 遵循 了 求 同 法 和 求 异 法 。 

韦伯 是 第 一 个 明确 区 分 了 实验 法 、 统 计 法 和 比较 法 的 人 。 首 先 ,他 认为 , 实 
验 法 只 适用 于 心理 学 研究 。 到 目前 为 止 ,社会 心理 学 确实 是 社会 科学 中 使 用 实 
验 法 的 一 个 分 支 。 第 二 ,统计 法 的 应 用 应 当 限 于 大 规模 现象 。 这 尤其 适用 于 微 
观 社会 学 和 人 口 学 等 分 支 。 第 三 ,韦伯 把 比较 法 作为 大 部 分 社会 学 分 析 的 最 佳 
方法 。 韦 伯 意 义 上 的 比较 法 ,主要 适用 于 宏观 社会 学 .人 类 学 ,政治 学 和 国际 关 
系 学 。 比 较 法 比较 尽 可 能 多 的 事件 ,这 些 事件 在 大 多 方面 都 相似 , 却 在 关键 特 
征 上 存在 差异 。 对 韦伯 而 言 ,尽管 发 现 一 个 决定 性 差异 可 能 只 是 幻想 ,但 如 同 
密 尔 认为 的 那样 , 求 异 法 最 为 关键 , 且 所 有 其 他 方法 均 可 被 还 原 为 求 异 法 (第 四 
种 方法 , “假想 实 验 ”, 亦 可 归 入 这 一 类 )。 

对 涂 尔 干 而 言 , 当 实验 不 可 行 时 , 那 就 仅 剩 “ 间 接 比较 ”( 即 统计 方法 ) 可 用 
了 。 他 认为 ,所 有 的 “第 三 变量 ”都 需要 被 控制 ,很 显然 ,这 是 不 可 能 的 ,因此 他 不 
认可 求 同 法 和 求 异 法 。 他 认为 ,只 有 共 变 法 是 能 够 建立 因果 关系 的 方法 。《 自 
杀 论 ) 就 是 他 基于 这 一 方法 论 立场 的 一 项 应 用 研究 。 





本 


斯 梅 尔 塞 在 韦伯 的 基础 上 采用 了 方法 的 三 分 法 (实验 、 统 计 、 比 较 )(Smels- 
er, 1996; Smelser，1973、1976), 且 使 得 比较 法 成 为 "建立 经 验 命题 的 基本 方法 
之 一 ”(Lijphart，1971:682; Jackman，1985) 。 在 此 必须 强调 的 是 ,尽管 存在 这 
种 三 分 法 ,但 所 有 方法 仍 是 基于 共同 方法 论 原则 的 。 此 外 ,所 有 方法 都 涉及 变 
量 分 析 :(1) 在 现象 之 间 建 立 联系 (实验 的 或 者 操作 的 自 变量 和 因 变 量 );(2) 其 他 
变量 被 控制 .[6 换 名 话说 ,在 所 有 方法 中 ,研究 者 们 都 使 用 列 联 表 (Lazarsfeld， 
1955:115) 。 


实验 的 、 统 计 的 与 比较 的 方法 


尽管 通过 三 分 法 划分 的 这 3 种 方法 并 不 互 斥 , 且 三 分 法 本 身 也 受到 批评 ,但 
韦伯 、 斯 梅 尔 塞 和 利 普 哈 特 (Lijphart) 等 人 在 发 展 社 会 科学 过 程 中 广泛 使 用 了 这 
一 方法 。 下 面 就 这 种 分 类 进行 简单 回顾 。 


实验 法 


帕 森 斯 指出 :“ 实 验 只 不 过 是 在 控制 条 件 下 ,生产 出 被 比较 个 案 的 比较 法 。” 
(Parsons，1949:743) 实 验 法 通过 有 意 操纵 变量 的 取 值 来 实现 控制 。 

实验 法 最 显著 特征 就 是 , 它 具 有 人 为 修改 变量 取 值 的 可 能 性 。 另 外 ,在 某 
些 情况 下 ,实验 最 显著 的 特征 就 是 随机 分 配 被 试 ,接受 处 理 。 这 种 方法 在 保持 
其 他 变量 取 值 不 变 的 情况 下 ,通过 操纵 操作 变量 来 评估 因果 关系 。 这 就 多 许 人 
为 分 离 观 测 变量 ,从 而 取得 最 大 化 的 控制 。 当 ( 自 ) 变 量 取 不 同 值 时 , 比较 其 结 
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果 , 这 是 实验 的 核心 特征 。 

实验 研究 设计 在 社会 科学 中 很 少见 。 在 大 部 分 情况 下 ,我 们 不 可 能 人 为 修 
改 现象 的 取 值 。 在 某 些 特殊 领域 ,通过 并 置 两 组 个 体 , 准 实验 条 件 可 得 到 满足 : 
第 一 组 (实验 组 ) 接 受 刺激 ,而 男 一 组 (控制 组 ) 不 接受 。 通 过 比较 这 两 组 的 结果 ， 
可 以 检验 刺激 的 作用 。 就 不 同学 科 分 支 而 言 ,在 社会 心理 学 中 , 准 实 验 设计 很 
典型 (例如 ,控制 组 和 实验 组 这 两 组 病人 对 药物 治疗 的 不 同 反 应 ) ,但 准 实验 设 
计 在 社会 科学 其 他 领域 也 同样 得 到 了 应 用 :政治 学 (宣传 力度 对 两 个 以 上 不 同 
群体 选举 行为 的 影响 ) ,社会 学 (工厂 中 影响 工作 条 件 的 各 种 因素 ,比如 灯光 、 颜 
色 , 工 间 休 息 、 工 作 服 是 否 包括 领带 ,等 等 ) 经 济 学 (市 场 化 与 沟通 策略 对 不 同 
消费 者 群体 的 影响 、 价 格 对 产品 评价 的 影响 ,等 等 )、 人 类 学 (气候 变化 导致 的 森 
林 砍 伐 以 及 对 部 落 内 部 社会 行为 的 不 同 影响 )。 


统计 研究 法 


当 研究 者 不 能 人 为 操控 现象 使 它们 变动 时 ,变异 控制 就 依赖 于 调查 中 
获得 的 不 同 个 案 在 不 同 变量 上 的 不 同 取 值 。 控 制 与 解释 需要 有 变异 才能 发 
生 。 在 实验 法 和 比较 法 中 , 自 变 量 对 因 变 量 的 作用 通过 它们 之 间 的 相关 性 
而 建立 。 在 实验 中 ,研究 者 在 自 变量 取 值 发 生 改 变 后 ,寻找 其 与 因 变量 取 值 
变化 的 相关 性 。 在 统计 法 中 ,研究 者 寻找 个 案 之 间 两 个 及 两 个 以 上 变量 取 
值 的 相关 性 。 

同样 ,通过 让 那些 可 能 影响 关键 关系 的 变量 取 常 数 ,使 得 控制 “第 三 ”变量 
得 以 实现 。 既 然 不 能 人 为 保证 这 些 因素 不 变 , 那 就 把 个 案 按照 相似 取 值 划分 到 
不 同 组 中 。 为 消除 年 龄 对 教育 水 平 与 政治 参与 度 关系 的 影响 (年 轻 一 代 教 育 程 
度 更 高 ,同时 政治 参与 度 也 与 年 长 一 代 不 同 ,这 会 导致 教育 与 政治 参与 度 两 者 
之 间 的 虚假 相关 ) ,样本 被 分 成 不 同 的 年 龄 组 ,并 在 每 一 个 年 龄 组 中 检验 教育 与 
参与 度 的 关系 。 


比较 研究 法 


利 普 哈 特 提出 :“ 比 较 法 不 过 就 是 在 相对 不 利 但 可 改进 的 情况 下 的 统计 方 
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法 。”(Lijphart，1975:163) 这 再 次 指向 了 方法 间 的 共同 性 。 

首先 ,与 其 他 两 种 方法 一 样 ,比较 法 同样 基于 变量 之 间 的 相关 性 。 例 如 , 布 
伦 纳 (Brenner) 关 于 前 工业 化 欧洲 农耕 结构 的 文章 ,就 利用 农奴 制 在 欧洲 东部 的 
兴盛 和 其 在 西部 的 衰落 来 解释 经 济 变迁 的 不 同 水 平 (Skocpol，1984a:381) 。 

其 次 ,与 实验 法 和 统计 法 一 样 , 比较 法 通过 把 个 案 划 到 具有 相似 变量 取 值 
的 不 同 组 中 ,来 消除 “第 三 ”变量 对 关键 关系 的 影响 。 

人 们 经 常 称 比较 法 的 特性 在 于 ,相对 统计 法 而 言 , 它 不 是 基于 “ 越 多 …… 则 
越 多 ……” 或 “ 越 多 …… 则 越 少 ……” 这 种 形式 的 相关 性 ,而 是 基于 二 分 数据 ( 现 
象 发 生还 是 不 发 生 )。 因 此 , 它 依赖 密 尔 的 归纳 逻辑 三 准则 : 求 同 法 、 求 异 法 、 求 
同 求 异 并 用 法 。 使 用 这 一 方法 的 学 者 宣称 ,比较 法 是 一 个 更 为 稳健 的 方法 , 因 
为 它 可 处 理 个 案 数 量 不 足 这 种 “不 利 情况 ”。 必 须 再 次 指出 ,尽管 如 此 ,比较 法 
与 统计 技术 的 共同 性 依然 很 强 。 统 计 学 在 最 近 这 些 年 发 展 出 有 效 的 技术 来 处 
理 二 分 与 定 类 变量 。 此 外 ,这 些 方法 宣称 适用 于 那些 个 案 数 量 过 小 而 难以 通过 
偏 相关 进行 系统 性 控制 的 情况 (Lijphart，1971:684) 。 但 在 此 情况 下 ,差异 还 是 
被 夸大 了 。 事 实 上 ,如 前 所 述 ,争论 只 是 指向 比较 研究 的 两 个 不 同 传统 :一 个 传 
统 基于 大 样本 统计 和 定量 设计 ,并 主要 应 用 于 跨国 分 析 ; 而 男 一 传统 则 基于 小 
样本 逻辑 与 定性 设计 。 这 些 区 别 将 在 下 文 进行 讨论 。 

总 之 ,在 此 需要 强调 两 点 。 第 一 ,尽管 这 3 种 方法 已 被 后 来 的 学 者 认为 
是 3 种 独立 的 方法 ,但 它们 并 不 互 床 。 例 如 ,( 准 ) 实 验 数据 常 通过 统计 技术 
进行 分 析 。 第 二 ,统计 技术 经 常 被 应 用 在 比较 的 情境 下 ,例如 ,社会 调查 数 
据 或 投票 行为 常 在 跨国 视角 下 进行 分 析 。 这 么 做 并 不 意味 着 使 用 了 一 个 独 
特 方法 。 


比较 的 类 型 : 大 样本 与 小 样本 
有 限 数 量 的 个 案 经 常 与 研究 问题 联系 在 一 起 ,这 使 方法 和 目标 之 间 的 相关 


性 非常 高 。 近 年 来 , 随 着 社会 科学 和 数据 收集 技术 的 发 展 , “个案 ”数量 增加 了 。 
这 导致 比较 研究 分 化 成 基于 统计 技术 的 大 样本 “宏观 分 析 ” 的 比较 研究 和 基于 
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一 些 典 型 个 案 的 小 规模 “对 比 取 向 ”的 比较 研究 (Evans-Pritchard，1963: 22; 
Skocpol & Somers，1980) 。 在 此 过 程 中 ,比较 分 析 形 成 了 两 个 不 同方 向 。 

首先 ,行为 主义 者 与 过 去 的 制度 的 .历史 的 整体 比较 决裂 ,形成 了 以 “ 量 
化 ”为 通用 语言 .大 规模 比较 、 利 用 统计 技术 分 析 个 体 数据 的 方法 。 这 一 方法 
近来 被 称 为 “大 样本 ”变量 取向 的 研究 。 对 全 世界 社会 系统 与 西方 现代 化 模式 
趋同 的 期 望 , 带 来 了 什么 都 是 “可 比 的 ”这 种 想法 。 同 时 ,这 种 通过 定量 指标 
对 通用 分 类 进行 操作 化 ,进而 对 不 同 社会 进行 分 析 的 信念 , 随 着 计算 机 革命 和 
大 量 电脑 数据 统计 分 析 技 术 的 发 展 ,得 到 了 加 强 。 这 类 研究 是 “比较 的 ”, 因 
为 它们 分 析 不 同 社会 .文化 .文明 以 及 政治 系统 ,但 从 方法 论 上 讲 , 它 们 属于 
统计 分 析 。 

其 次 , 自 20 世纪 60 年 代 以 来 ,社会 与 政治 系统 的 趋 异 而 非 趋同 ,使 得 学 者 
们 转向 更 有 限 的 (更 实际 的 ) 比 较 , 比 较 同 质 性 地 区 的 有 限 个 案 。 对 社会 和 政治 
情境 的 重新 关注 意味 着 回归 到 定性 的 (例如 ,离散 的 ,分 类 的 、 名 义 的 和 二 分 的 ) 
ta Mn gn id an nsdn 新 
技术 是 在 密 尔 逻 辑 和 布尔 代数 的 基础 上 发 展 起 来 的 。 这 一 取向 如 今 被 称 为 “小 
样本 ”个 案 取 向 的 研究 ,因为 ee 


大 规模 比较 研究 


关于 “比较 方法 论 ” 的 著作 与 比较 调查 分 析 及 多 /跨国 研究 这 两 个 新 领域 同 
步 发 展 。20 世纪 五 六 十 年 代 , 美 国 和 欧洲 组 织 了 大 量 的 跨国 研究 ,这 带 来 了 国 
际 社 会 科学 的 合作 ,并 形成 了 国际 性 研究 团队 。 这 一 发 展 的 结果 是 ,国家 的 数 
量 ( 样 本 数 ) 增 多 了 ,基于 大 量 个 案 的 研究 也 增多 了 。 

大 样本 比较 研究 都 基于 统计 研究 设计 .L"] 正 如 前 面 提 到 的 ,“ 比 较 的 ” 

一 名 称 在 此 不 指 代 一 个 独特 方法 ,而 更 多 的 是 指 研究 设计 中 出 现 了 国家 ， 
国家 在 这 里 只 是 被 当做 “情境 ”变量 ,代表 在 解释 性 陈述 中 ,民族 国家 或 社会 
层面 的 属性 。 一 国 的 宏观 社会 层面 (因素 ) 被 当做 个 体 层 次 解释 性 陈述 的 控 
制 变量 (或 者 说 残 差 变量 ) (Przeworski & Teune, 1970; Teune & Ostrows- 
ki, 1973), 
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在 大 规模 比较 研究 中 , 比较 方法 作为 基于 统计 设计 的 研究 策略 出 现 , 而 这 
种 策略 包含 了 大 量 的 国家 。 这 一 广义 的 比较 法 定义 强调 了 设计 (在 变量 和 个 案 
数目 之 间 的 平衡 .指标 与 数据 的 可 比 性 等 ) ,而 不 是 具体 的 逻辑 过 程 。 

“比较 法 ”这 一 名 称 被 用 于 指 代 一 种 特定 技术 ,并 不 表示 比较 分 析 不 可 以 使 
用 统计 技术 。 恰 好 相反 ,许多 十 分 重要 的 比较 研究 本 质 上 都 是 统计 的 ,关于 比 
较 最 有 影响 的 一 本 书 , 正 是 介绍 如 何 使 用 统计 为 比较 服务 的 (Przeworski & 
Teune, 1970)。 在 此 情况 下 ,“ 比 较 方法 ”这 一 名 称 ,与 其 说 是 区 分 出 了 一 种 独特 
方法 ,不 如 说 在 国家 作为 观察 单位 的 层次 上 ,比较 法 被 包括 在 统计 研究 设计 中 ， 
作为 操作 或 控制 变量 。 

统计 技术 ,例如 列 联 表 、 方 差分 析 、 因 子 分 析 、 相 关 分 析 、 多 元 回归 、 对 数 线 
性 分 析 等 等 , 常 被 用 于 比较 研究 (例如 ,跨国 研究 或 更 一 般 而 言 , 跨 部 门 研究 )。 
本 书 的 目的 并 非 回 顾 可 用 于 此 类 研究 的 统计 技术 。L 引 涉及 统计 设计 的 跨 部 门 分 
析 , 可 通过 以 下 两 种 方法 进行 : 

第 一 ,利用 个 体 层次 个 案 。 将 个 体 数 据 ( 例 如 ,社会 调查 数据 ) 按 照 国家 
或 者 其 他 跨 部 门 层次 分 开 , 然 后 把 总 体 跨 部 门 层次 变量 作为 干预 变量 或 控 
制 变量 (例如 , 某 研究 关注 在 不 同 国家 之 间 的 宗教 派别 对 堕胎 看 法 影响 的 差 
异 ,我 们 希望 考察 在 具有 不 同 移民 整合 传统 的 国家 之 间 , 这 种 关系 是 否 依 然 
成 立 )。 在 此 例 中 ,“ 国 家 ”不 如 变量 (作为 移民 整合 传统 类 型 上 的 得 分 的 载 
DER, 

第 二 ,利用 跨 部 门 个 案 。 将 数据 从 跨 部 门 (地 域 ) 单 位 那里 收集 而 来 ,比如 
国家 。 同 时 ,利用 统计 技术 把 国家 本 身 当做 个 案 来 进行 分 析 ( 只 要 样本 够 大 ,这 
完全 可 行 )。 举 个 例子 ,对 30 个 OECD 国家 (经 济 合 作 与 发 展 组 织 ) 的 劳工 管制 
和 失业 率 水 平 进行 分 析 。 在 此 例 中 ,“ 国 家 ”是 重要 的 ,因为 它们 代表 了 劳工 管 
制 和 失业 率 水 平分 数 的 变异 。 

在 一 国之 内 进行 的 社会 调查 不 能 被 认为 是 比较 研究 。 但 如 果 这 个 调查 覆 
盖 了 两 个 及 两 个 以 上 国家 , 那 在 此 意义 上 , 它 就 成 为 了 “比较 的 ”研究 。 这 不 表 
示 说 它 使 用 了 独特 的 “比较 法 ”, 它 只 是 在 跨国 语 境 下 进行 的 统计 设计 。 同 样 ， 
利用 150 个 国家 定量 数据 进行 的 统计 分 析 , 或 许可 被 认为 是 “比较 的 ”, 尽 管 它 基 
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于 统计 技术 。 在 这 两 个 案例 中 ,我 们 讨论 的 是 一 种 比较 的 视角 或 策略 ,而 非 一 
种 比较 方法 。 


小 规模 比较 研究 


相当 部 分 的 比较 研究 都 基于 一 种 特定 方法 一 一 比较 的 一 一 区 别 于 统计 方 
法 。 许 多 比较 研究 分 析 很 少数 量 的 个 案 。 这 与 研究 问题 相关 。 在 许多 领域 ， 
经 验 个 案 的 数目 小 到 无 法 进行 统计 推断 ,“ 社 会 革命 的 数量 太 少 了 ”(Ragin， 
1987:11)[9] ,因此 那些 处 理 只 有 少数 个 案 的 研究 问题 的 学 者 把 “比较 法 ”与 大 
规模 比较 研究 区 别 开 来 。 这 些 文献 提出 一 种 独特 方法 。 他 们 强调 的 不 是 研究 
设计 ,而 是 独特 的 逻辑 过 程 ,这 一 人 逻辑 过 程 基 于 必要 与 充分 条 件 、 密 尔 法 则 以 
及 布尔 代数 。 大 规模 比较 研究 学 者 把 比较 法 当做 统计 学 在 大 规模 样本 研究 设 
计 中 的 应 用 ,而 小 规模 比较 研究 学 者 就 把 比较 法 当做 把 逻辑 或 布尔 代数 应 用 
到 少数 个 案 中 。 

例如 ,斯 考 切 波 在 她 关于 革命 的 研究 中 ,发 展 出 一 种 区 别 于 大 规模 比较 中 
使 用 的 多 元 统计 方法 的 特定 比较 逻辑 (Skocpol，1979: 36 一 37; 1984a: 378 一 
379)。 同 样 , 拉 津 区 分 了 个案 取向 ?方法 与 “变量 取向 ?方法 (Ragin，1987; Ra- 
gin&. Zarer, 1983)。“ 比 较 法 ”这 一 名 称 只 属于 个 案 取 向 方法 ,以 求 同 法 和 求 异 
法 为 代表 ;而 变量 取向 方法 则 等 同 于 统计 方法 。 个 案 取 向 方法 使 得 小 样本 研究 
可 以 要 求 一 个 新 的 方法 论 地 位 ,而 不 再 被 视 为 “不 完美 ”的 统计 设计 。 


深入 与 宽泛 的 研究 设计 


大 样本 与 小 样本 比较 研究 设计 的 差异 最 终 体现 在 变量 和 个 案 数 量 的 平 
衡 上 。 

如 果 一 项 研究 设计 关注 少数 个 案 , 又 有 许多 变量 ,那么 ,这 就 属于 深入 
比较 人 研究。 而 如 果 一 项 研究 设计 包含 了 少数 变量 , 却 有 大 量 个 案 , 那 么 这 属 
于 宽泛 研究 分 析 。 这 种 深入 与 宽泛 研究 设计 的 对 比 可 用 下 面 这 个 数据 矩阵 
KIR: 
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特征 /属性 的 数量 
(变量 ) 


-个 少数 许多 


小 规模 比较 研究 
(“个 案 取向 ”) 


大 规模 比较 研究 
(“变量 取向 ”) 





在 此 需要 提 及 的 是 ,最 近 有 一 场 争 论 正在 展开 。“ 个 案 取 向 ”方法 宣称 , 具 
有 统计 技术 不 具备 的 几 项 优势 :个 案 取 向 方法 是 一 种 更 深入 的 分 析 类 型 ;变量 
取向 方法 把 个 案 拆 分 成 变量 , 且 个 案 整 体 的 特殊 构造 被 忽视 ,因此 可 被 视 为 是 
还 原 论 的 。 然 而 就 目前 来 看 ,学 界 对 个 案 取 向 技术 是 否 能 比 多 元 统计 技术 更 好 
地 处 理 名 义 和 虚 拟 变量 (Goldthorpe，1997a、1997b) 尚 未 达成 共识 。 统 计 技 术 
近年 来 在 这 些 方面 有 长 足 进步 。 而 有 些 批评 则 认为 ,个 案 取 向 方法 是 历史 的 倒 
退 ( 关 于 这 个 争论 的 各 种 观点 ,在 第 8 章 和 结论 部 分 有 所 提 及 )。 


和 


个 案 的 选择 


分 析 单 位 


比较 研究 可 利用 尽 可 能 多 的 个 案 。 不 仅 如 此 ,比较 法 还 适用 于 不 同类 型 的 
分 析 单 位 。 比 较 法 的 应 用 并 没有 什么 逻辑 限制 ,因为 逻辑 程序 独立 于 比较 单位 
的 数量 与 类 型 。 

有 4 种 主要 的 比较 单位 类 型 : 

第 一 ,个 体 单位 。 尽 管 并 不 常见 ,但 比较 法 的 确 可 应 用 于 个 体 层 次 。 比 如 ， 
领袖 研究 (沟通 式 官员 继任 者 对 党 派 凝 珍 力 的 影响 .革命 领 袖 的 人 格 , 等 等)。 

第 二 ,地 域 ( 跨 部 门 ) 单 位 。 这 是 比较 分 析 的 “典型 单位 >。 地 理 和 空间 单位 
包括 各 级 政府 :地 方 政 府 ( 公 社 、 县 ) 省 或 地 区 、 联 邦 单位 (美国 的 州 、 德 国 的 邦 ) 
以 及 民族 国家 。 地 域 单位 并 不 一 定 要 按照 客观 边界 或 数据 本 身 来 定义 , 亦 可 由 
非 客观 属性 定义 。 马 克 斯 "韦伯 分 析 为 何 资本 主义 在 西方 而 非 在 东方 兴起 时 ， 
就 分 析 了 一 国内 部 天 主教 和 新 教 地 区 的 差异 。 

第 三 ,功能 单位 。 比 较 经 常 在 群体 .运动 和 组 织 间 进行 。 这 种 比较 关注 政 
治 党 派 或 部 落 、 工 会 ( 议 ) 院 外 活动 集团 和 利益 团体 或 家 庭 结 构 ( 一 国之 内 或 跨 
国 )。 比 较 研 究 设 计 会 比较 一 国之 内 的 和 平 主义 运动 和 女性 主义 运动 ,或 跨国 
的 两 个 及 两 个 以 上 党 派 的 意识 形态 。 功 能 单位 也 可 以 包括 国际 组 织 ( 比 如 , 比 
较 欧盟 与 北美 自由 贸易 协定 国家 ,比较 国际 货币 基金 组 织 与 世界 银行 ) ,在 市 场 
分 析 中 的 消费 者 群体 ,或 者 人 类 学 研究 中 的 不 同 部 落 。 
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第 四 ,时 间 单 位 。 目 前 对 时 间 单 位 而 言 , 我 们 首先 需要 区 分 时 点 和 时 期 
(Bartolini，1993:147 一 153) 。 举 个 经 济 学 的 例子 ,比较 时 点 上 和 :上 十 1 的 通货 膨 
胀 就 是 时 点 间 的 比较 。 比 较 欧 洲 共同 货币 (欧元 ) 引 入 之 前 和 之 后 的 通货 膨胀 
就 是 时 期 间 的 比较 。 其 次 ,要 区 分 跨 部 门 单位 是 客观 单位 还 是 非 客 观 单位 。 客 
观 意 味 着 时 期 是 由 数据 本 身 决定 的 ,比如 议会 .两 次 党 派 大 会 之 间 、 人 口 普查 等 
等 。 在 有 些 情况 下 ,数据 本 身 并 未 提供 客观 标准 ,可 以 根据 它们 在 每 一 时 期 内 
具有 的 同 质 属性 或 取 值 进行 归 类 。 当 并 非 所 有 变量 都 可 用 同一 时 间 单 位 来 测 
量 时 , 归 类 就 会 出 现 问题 。 

时 间 增 加 了 一 个 变异 的 维度 。 我 们 比较 的 是 不 同 个 案 共 享 属 性 的 取 值 。 
在 趋势 和 纵 贯 数据 中 ,每 个 个 体 或 跨 部 门 个 案 在 不 同时 点 或 时 期 ,每 一 个 属性 
或 变量 都 有 不 同 的 取 值 。 时 点 或 时 期 在 个 体 和 跨 部 门 单位 中 用 同样 方法 处 理 
(Bartolini,，1993:146)。 在 发 展 的 或 序列 的 一 般 化 理论 中 ,“ 增 长 ”就 是 指 从 一 个 
时 期 到 另 一 个 时 期 时 ,变量 的 取 值 增加 了 。 

由 此 ,研究 设计 不 仅 可 被 分 为 大 规模 一 小 规模 比较 研究 ,还 可 被 分 为 同时 
性 和 历时 性 ( 纵 贯 的 ) 比 较 研 究 。 同 时 性 研究 指 对 跨 部 门 ,功能 的 或 个 体 的 个 案 
只 在 一 个 时 点 或 时 期 的 取 值 进行 测量 。 历 时 性 研究 指 对 跨 部 门 、 功 能 的 或 个 体 
的 个 案 在 不 同时 点 或 不 同时 期 的 取 值 均 进 行 测量 。 

如 上 所 述 , 一 项 研究 设计 可 以 是 深入 的 (个 案 少 而 变量 多 ) 或 者 是 宽泛 的 
(个 案 多 而 变量 少 )。 而 这 两 者 均 可 是 同时 性 或 历时 性 的 。 

时 间作 为 变异 的 一 个 维度 , 常 被 当做 增加 个 案 数 目的 方法 来 解决 “小 样本 问 
题 ”。 人 们 经 常 这 么 做 ,以 期 能 用 统计 技术 进行 分 析 。 纵 贯 分 析 的 优势 在 于 , 它 可 
以 在 相同 的 情境 下 ,控制 许多 属性 之 后 再 比较 不 同 个 案 (Lijphart，1971、1975) 。 

此 类 “个 案 延 展 ?或 “ 相 乘 样本 扩充 法 ”(Lijphart，1975; Sigelman，1977) 是 
有 问题 的 ,因为 这 些 多 时 点 观察 值 不 被 认为 是 单独 的 个 案 ,它们 并 非 彼 此 独立 。 





时 间 : 变 量 、 历 史 多 重 共 线 性 与 扩散 


进行 历时 性 比较 研究 时 , 需 注意 以 下 3 点 : 
首先 ,时 间 个 案 ( 观 察 单位 ) 不 应 该 与 时 间 变 量 ( 变 异 单位 ) 混 淆 。 在 历史 比 
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较 研 究 中 ,这 点 尤为 重要 。 举 个 例子 ,一 项 研究 设计 的 因 变量 是 民主 化 的 时 机 。 
按照 通常 对 时 机 的 操作 化 方式 ,我 们 区 分 “ 早 ”( 例 如 ,英国 ) 和 *“ 晚 《例如 ,俄国 )。 
因 变 量 是 时 间 性 的 ,“ 早 ”和 “ 晚 ” 是 其 两 个 定 序 的 取 值 。 时 间 变 量 也 可 以 是 自 变 
量 。 例 如 ,有 人 会 用 工业 化 的 先后 顺序 作为 解释 变量 来 解释 民主 化 的 时 机 (如 
果 工 业 化 先 于 民族 国家 出 现 , 那 么 民主 化 就 不 易 较 早 发 生 )。 





时 间 变 量 的 例子 如 下 : 
变 量 取 值 
时 机 早 / 晚 
序列 前 /后 
速度 快 / 慢 


其 次 ,使 用 纵 贯 数据 会 导致 历史 多 重 共 线 性 ,因为 分 析 单 位 是 时 点 或 时 期 
(时 间 序 列 ), 这 导致 变量 之 间 强 烈 相关 (Bartolini, 1993: 157—160; Thrupp. 
1970)。 但 这 一 变量 间 的 关系 是 虚假 的 , 因为 实际 上 ,这 是 由 时 间 变 化 导致 的 。 
当 处 理 那 些 倾向 于 与 时 间 平 行 变化 的 社会 经 济 和 政治 变量 时 ,这 种 风险 尤其 
高 。 比 如 ,工业 革命 以 来 ,所 有 社会 经 济 指标 都 随时 间 而 增长 。 正 如 巴尔 托 利 
尼 指 出 的 : 


如 果 ( 自 变量 或 因 变 量 ) 随 时 间 而 变 的 趋势 都 与 一 个 更 一 般 过 程 的 变 
化 相 联系 ,存在 一 个 平行 的 现象 束 , 且 这 些 现 象 之 间 有 内 在 关联 ,因此 高 度 
相关 ,那么 大 部 分 因素 都 与 更 一 般 过 程 的 变动 联系 在 一 起 …… 在 这 种 情况 
下 , 它 也 与 因 变 量 联系 在 一 起 。(Bartolini，1993:158) 。 


因此 ,分 析 时 间 个 案 时 ,必须 关注 不 同 跨 部 门 个 案 与 这 一 趋势 的 背离 。 分 
析 趋 势 时 ,应 当 分 析 其 相对 趋势 ,就 是 说 , 相 比 其 他 个 案 , 它 发 生得 早 或 晚 . 快 或 
慢 。 这 就 可 把 时 间 性 和 器 部 门 的 变异 结合 起 来 。 研 究 者 可 以 诉 诸 * 随 时 间 而 滑 
动 的 同时 性 比较 ”(Bartolini，1993:159) ,我 们 必须 把 跨 部 门 单位 的 变异 加 入 跨 
时 间 的 变异 中 去 。“ 更 早 有 …… 则 有 更 快 的 ……” 这 种 概括 暗示 了 除 单 一 跨 部 
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门 单位 之 外 ,还 有 更 多 的 考虑 (时 间 )。 

最 后 ,在 时 间 发 展 上 ,无 论 是 组 织 还 是 地 域 单 位 (例如 ,政治 系统 ) ,社会 经 
济 和 政治 现象 都 “有 时 间 ” 从 一 个 个 案 扩散 到 男 一 个 。 这 导致 (不 同 个 案 间 ) 变 
量 的 取 值 随时 间 流 逝 而 趋同 。 因 此 , 跨 部 门 个 案 也 不 是 完全 相互 独立 的 。 


选择 性 偏差 


选择 性 偏差 来 源 于 从 大 样本 中 抽取 部 分 样本 进行 分 析 。 存 在 两 种 偏差 
(Geddes, 1990): 

首先 ,有 偏 推论 。 这 种 偏差 来 自 “不 根据 随机 原则 ,而 往往 根据 结果 选取 用 
于 形成 推论 的 样本 ,这 便 不 具 统 计 学 意义 上 的 总 体 代表 性 ”(Collier，1995: 
462) 。 我 们 不 能 把 根据 一 个 子 样本 得 到 的 结论 推广 到 总 体 中 。 这 是 一 般 化 问题 
(外 部 有 效 性 )。 

其 次 ,有 偏 因 果 关 系 。 这 种 偏差 起 源 于 使 用 不 同 的 样本 会 导致 不 同 的 因果 
关系 的 结论 :个 案 不 同 ,结论 就 不 同 。 个 案 在 因 变 量 分 布 的 一 端 被 过 度 代表 ,而 
在 另 一 端 则 被 “ 删 截 ”。“ 据 因 变 量 而 选择 ” 指 在 因 变量 上 取 值 的 分 布 有 偏 ,导致 
样本 的 因 变量 分 布 不 对 称 ( 例 如 ,只 选取 那些 政治 稳定 性 分 数 较 高 的 国家 )。 这 
是 设 定 问 题 (内 部 有 效 性 ) 。 

在 比较 分 析 中 ,选择 性 偏差 有 5 种 潜在 原因 : 

第 一 ,研究 设计 。 涉 及 样本 的 个 案 选 择 。 如 果 研 究 者 研究 所 有 个 案 , 那 就 
不 存在 选择 性 偏差 。 严 格 而 言 ,研究 者 不 只 是 在 “选择 ”, 有 些 分 类 ,如 “第 三 世 
界 ” 或 “工业 化 国家 ”, 从 来 就 不 是 完全 客观 的 ,而 是 包含 理论 建构 的 。 

就 跨 部 门 个 案 而 言 ,最 常见 的 选择 性 偏差 是 选择 那些 成 功 的 个 案 , 即 排除 
了 “反例 ”( 参 见 下 面 第 四 点 )。 例 如 ,在 一 个 关于 选举 改革 的 研究 中 ,研究 者 只 
虑 那些 选举 制度 发 生 了 变化 的 国家 ,如 从 比例 代表 制 转 到 多 数 制 或 者 相反 。 这 
种 偏差 的 最 极端 形式 是 , 因 变 量 只 有 一 个 取 值 (King, Keohane & Verba, 1994; 
130) 。 选 择 性 偏差 也 可 影响 时 间 单 位 ,如 我 们 可 能 从 很 长 的 时 间 序 列 中 武断 地 
选取 特定 时 点 。 分 析 者 常会 选择 那些 变量 取 值 达到 高 点 或 低 点 的 时 点 。 在 这 
种 情况 下 ,变异 范围 被 删 截 了 。 最 常见 的 偏差 是 只 关注 时 间 序 列 的 终点 ,如 选 
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取 较 近 时 期 将 高 估 最 近 变 化 的 影响 (Collier & Mahoney, 1996; Geddes，1990: 
146 一 147) 。 

比较 法 有 时 利用 密 尔 求 同 法 来 建立 因果 关系 ,此 时 ,这 种 选择 性 偏差 就 会 很 
关键 。 在 求 同 法 中 ,个 案 在 大 量 的 属性 方面 有 差异 ,有 时 甚至 是 反 事实 的 (Collier， 
1995; Fearon, 1991; Peters, 1998:72) ,而 研究 者 会 根据 结果 是 否 正 面 来 选择 
个 案 ( 例 如 ,事件 发 生 )。 这 正 是 “根据 因 变 量 进行 选择 ”大 部 分 个 案 都 在 因 变量 
上 取 值 相同 )。 如 格 迪 斯 所 强调 的 ,如 果 不 把 因 变量 取 值 不 同 的 反例 纳入 分 析 ， 
“我 们 根本 不 能 判断 我 们 发 现 的 那些 重要 因素 是 否 真 的 是 重要 前 提 ”(Geddes， 
1990:132)。 正 如 下 面 讨论 的 ,在 此 情况 下 ,只 能 建立 必要 条 件 ,而 不 能 建立 充分 
条 件 。 

第 二 ,历史 偶然 性 。 历 史 偶然 性 问题 关注 普遍 性 。 总 体 本 身 在 因 变 量 上 会 
进行 “自我 选择 ”。 即 使 我 们 纳入 所 有 现存 个 案 , 如 国家 , 它 也 不 能 回避 选择 性 
偏差 问题 。 真 实 世 界 中 所 有 个 案 都 有 偏 ,它们 都 是 “自然 的 ”或 “历史 偶然 的 ” 结 
果 , 这 意味 着 ,可 选择 个 案由 于 社会 过 程 的 作用 而 产生 偏差 。 

历史 偶然 性 导致 了 “自我 选择 ?的 个 案 。 选 择 一 个 国际 组 织 的 成 员 国 ( 经 济 
合作 与 发 展 组 织 或 欧洲 联盟 ) 隐 含 了 这 些 组 织 中 的 个 案 都 是 “自我 选择 ”的 , 因 
为 它们 都 加 入 了 这 个 组 织 (Ebbinghaus，2005)。 更 激进 的 看 法 是 ,在 分 析 民 族 
国家 时 ,一 开始 就 有 偏差 。 我 们 只 把 那些 在 自然 和 历史 选择 过 程 中 “存活 ”的 政 
治 单位 作为 分 析 单 位 (Tilly，1975a:15)。 如 果 因 变量 是 国家 形成 ,那么 只 有 成 
功 个 案 而 无 失败 个 案 ( 例 如 ,那些 “消失 ”了 的 国家 )。 

拉 津 把 历史 偶然 性 带 来 的 问题 称 为 “有限 差异 或 多 样 性 ”(Ragin，1987: 
25—27, 104—113) , 即 个 案 的 取 值 不 能 涵盖 全 部 可 能 的 理论 取 值 范 围 , 历 史 不 
能 提供 所 有 可 能 的 组 合 。 例 如 ,在 发 达 工 业 化 经 济 体 中 ,所 有 的 新 教 国家 都 较 
早 实现 了 民主 化 。 由 此 ,历史 偶然 性 对 根据 样本 推论 总 体 的 行为 有 重要 影响 。 
作为 一 项 基本 原则 ,选取 样本 的 标准 必须 与 因 变 量 无 关 。 然 而 ,如 果 在 某 特定 
时 点 上 ,总 体 只 包括 了 那些 经 过 “历史 ?或 “自然 ?选择 的 个 案 ,那么 随机 样本 也 
是 “ 据 因 变量 而 选择 ”的 。 如 格 迪 斯 所 言 ,不 能 通过 考察 那些 在 18 世纪 存活 的 民 
族 国家 来 评估 军事 创新 对 国家 形成 的 影响 ,因为 所 有 存活 的 国家 都 有 那些 创新 
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(Geddes, 1990;135). 

第 三 ,“ 高 尔 顿 问题 "。 首 先 介绍 一 下 这 一 问题 。 它 源 于 19 世纪 时 ,博学 的 
人 类 学 家 弗朗西斯 。 高 尔 顿 (Francis Galton) 批 评 爱 德 华 ， 泰 勒 (Edward 
Tylor) 的 一 篇 比较 研究 的 文章 ,这 篇 文章 讲 的 是 跨 部 门 个 案 的 两 个 二 分 变量 之 
间 的 相关 性 。 高 尔 顿 批 评说 ,这 结果 不 过 是 个 案 间 扩散 的 结果 ,而 非 变量 间 因 
果 关 系 的 产物 。 这 是 扩散 的 产物 ,而 非 功 能 的 联系 。 

从 操作 角度 讲 , 扩散 确实 是 相关 变量 间 关 联 的 一 个 影响 因素 (Smelser， 
1976:212)。 扩 散 过 程 作用 的 存在 ,使 得 功能 联系 成 为 虚假 相关 (Lijphart， 
1975:171)。 从 统计 上 讲 ,个 案 间 的 扩散 或 传播 过 程 违反 了 分 析 单 位 相互 独立 的 
假设 。 分 析 单 位 ,无 论 是 组 织 还 是 地 域 单位 ,都 并 非 孤 立 的 。 时 间 性 发 展 则 是 
现象 从 一 个 个 案 传 到 男 一 个 。 这 或 许 就 解释 了 变量 取 值 随时 间 变 化 的 趋同 
现象 .[10] 

大 部 分 单位 都 是 受制 于 外 部 影响 的 开放 系统 :(1) 模 仿 、 借 用 ,并 从 他 人 的 
实践 中 得 到 经 验 (Ross & Homer,1976);(2) 当 它们 属于 某 个 外 部 整合 性 组 
织 时 ,它们 会 进行 交换 或 协调 ;(3) 有 时 会 受到 征服 ,殖民 ,经 济 依赖 等 因素 的 
限制 (Moul，1974);(4)“ 社 会 裂变 ”, 即 从 共同 的 原初 系统 中 迁移 或 者 分 裂 出 
Æ (Strauss &- Orans,1975)。 这 里 存在 的 风险 是 最 终 样 本 数 为 1。 普 沃 斯 基 
和 特 恩 (Przeworski & Teune, 1970) [alia : “我们 观察 到 了 多 少 个 独立 事件 ”如 
果 一 个 系统 中 的 相似 性 只 是 扩散 的 结果 ,那么 只 有 一 个 独立 观察 值 。”(Przewor- 
ski &. Teune,，1970:52) 而 自由 度 则 为 0. 因此, “如果 研究 单位 不 是 独立 的 …… 
那么 ,研究 它 两 遍 并 不 会 带 来 新 信息 …… 而 把 它 计 算 两 次 也 不 能 带 来 额外 的 确 
证 ”(Zelditch, 1971:282 一 283)。 

这 一 问题 随 着 跨国 化 进程 .交通 的 改善 .信息 的 传播 .交换 的 加 速 而 变 得 更 
为 严重 。“ 在 一 个 相互 依赖 的 世界 里 ,比较 社会 科学 家 开始 意识 到 ,社会 现象 不 
是 孤立 与 自足 的 ,而 会 受到 其 他 国家 发 生 的 国内 事件 的 影响 .”(Klingman， 
1980:123) 世 界 在 变 小 ,因此 这 个 问题 比 过 去 更 严重 了 。 比 如 ,我 们 可 以 合理 地 
假设 ,不 同 国家 的 福利 国家 制度 的 发 展 受到 了 扩散 过 程 的 影响 (Collier & Mes- 
sick，1975) 。 梯 利 (Tilly，1984) 就 批评 罗 坎 (Rokkan) 模 型 ,指出 他 未 能 真正 分 
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析 国 家 之 间 的 互动 。 

然后 , 谈 一 下 解决 方案 。 这 里 有 两 个 极端 。 一 个 极端 是 有 条 件 地 投降 ” 
(Sztompka，1988)。 整 个 世界 都 是 一 个 个 案 , 人 研究 应 当局 限于 关注 抵抗 全 球 化 
的 那些 “独特 性 ”。 男 一 个 极端 拒绝 夸大 这 个 问题 (Blaut,，1977)。“ 半 扩散 ”这 

一 术语 (对 应 超 扩散 ) 表 明 :(1) 某 些 社会 对 外 部 影响 的 抵抗 力 更 强 ( 因 为 选择 性 
接纳 .文化 抵制 .不 习惯 创新 );(2) 扩 散 只 存在 于 某 些 领域 (例如 ,货币 政策 ) 而 不 
存在 于 另 一 些 领域 (一 个 国家 的 民族 构成 ) 。 

在 这 两 个 极端 之 间 , 有 以 下 解决 方案 : 

第 一 , 跨 部 门 抽样 。 大 部 分 解决 方案 试图 “控制 ”选择 个 案 过 程 中 变量 的 
“扩散 ”(Naroll，1961、1964、1965、1968; Naroll & D’Andrade, 1963; Well- 
hofer,，1989) 。 在 最 先 遇 到 高 尔 顿 问题 的 人 类 学 中 ,解决 方案 是 选择 那些 并 无 联 
系 的 国家 ,那么 扩散 就 不 太 可 能 发 生 。 这 实际 上 等 同 于 “差异 最 大 设计 ” 
(MDSD) 。 尽 量 在 不 同 的 情境 下 选择 个 案 , 个 案 的 选择 仍 保证 了 它们 的 相互 独 
立 性 。 但 这 在 当代 工业 化 社会 中 依然 是 有 问题 的 (Moul, 1974; Peters, 1998; 
41—43), 

SB PEED BOTT HEHE. A RENOM D ET RE EEE ME” RREA E. 
依赖 (Pryor，1976) ,包括 社会 之 间 潜 在 扩散 的 度量 。 这 些 度量 基于 语言 相似 性 
和 地 理 接近 性 等 因素 (Ross & Homer，1976) 。 扩 散 可 能 性 矩阵 提供 了 作为 控 
制 因 素 的 情境 变量 。 同 样 ,还 有 人 使 用 国际 依赖 度 指标 (例如 ,贸易 构成 指标 )。 

第 三 ,时 间 序 列 分 析 。 对 有 些 人 来 说 ,高 尔 顿 问题 是 个 案 间 的 统计 相依 性 。 
要 解决 这 个 问题 ,只 需 把 扩散 过 程 也 纳入 分 析 , 即 在 回归 分 析 中 对 相互 依赖 建 
AHRI (Goldthorpe, 2000:56; Klingman，1980) 。 时 间 序 列 分 析 可 整合 跨 系 统 
的 扩散 效应 , 即 因 变 量 在 不 同系 统 间 的 空间 扩散 性 。 当 然 , 这 并 不 适用 于 小 样 
本 设计 。 

第 四 ,选择 反例 。 有 偏 结果 也 可 能 发 生 在 选择 反例 的 过 程 中 。 直 到 最 近 ， 
这 一 问题 才 得 到 应 有 的 重视 。 研 究 者 该 如 何 决定 一 个 反例 , 即 “ 未 发 生 事件 ”? 
“ 何 时 何 地 会 有 “ 非 社会 革命 发 生 ?”(Mahoney & Goertz，2004:653) 反 例 之 所 
以 重要 ,有 两 个 原因 :第 一 ,它们 影响 了 正面 案例 和 反面 案例 的 频数 分 布 , 这 使 
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得 要 么 正面 的 ,要 么 反面 的 个 案 更 加 “少见 ”; 第 二 ,选取 不 同 的 个 案 , 会 导致 对 
原因 的 分 析 不 同 。 纳 入 或 者 排斥 某 些 个 案 会 影响 结果 ,因为 个 案 往往 具有 不 同 
的 取 值 (内 部 有 效 性 )。 

我 们 要 么 把 这 个 案 当 做 反例 (未 发 生 革命 ,没有 战争 ) ,要么 把 它 当 做 无 关 
的 。 反 例 是 分 析 样本 的 一 部 分 。 而 无 关 个 案 则 并 非 研究 事例 。 如 果 要 考察 第 
二 次 世界 大 战 期 间 , 各 国 加 入 同盟 国 的 影响 因素 ,那么 应 该 将 瑞士 作为 未 加 入 
的 个 案 ( 反 例 ) ,而 把 玻利维亚 当做 无 关 个 案 。 把 无 关 个 案 纳 入 分 析 会 额外 增加 
总 体 的 反例 数量 ,从 而 导致 反例 被 过 度 代表 。 相 反 , 如 果 太 多 的 反例 被 排除 在 
分 析 之 外 , 那 会 导致 正面 案例 过 度 代表 问题 ,这 同样 是 偏差 来 源 之 一 。 

如 何 确 定 个 案 是 反面 案例 还 是 无 关 案例 ?“ 可 能 性 原则 ?提供 了 一 个 参考 。 
根据 这 一 原则 “只 有 那些 结果 是 可 能 发 生 的 个 案 , 才 被 归 人 反例 。 那 些 根本 不 
可 能 发 生 的 个 案 应 当 被 归 为 无 效 信息 ,被 列 为 无 关 个 案 ”(Mahoney & Goertz, 
2004:653)。 

斯 考 切 波 同 样 建议 ,除了 在 因 变 量 上 有 差异 ,反例 应 当 与 正 例 在 各 方面 尽 
可 能 相似 (Skocpol,，1984a)。 同 样 , 拉 津 认为 , “反例 应 当 在 尽量 多 的 方面 与 正 
例 相似 ,尤其 是 在 与 正 例 展现 出 来 的 共同 点 上 ”(Ragin，2000:60)。 而 “可 能 性 
原则 ”把 以 上 观点 正式 化 了 (Mahoney & Goertz, 2004:657 一 658) 。 可 能 性 原则 
指 ,选择 那些 有 可 能 发 生 的 反例 。 纳 入 原则 指 ,如 果 个 案 取 值 在 至 少 一 个 自 变 
量 上 与 关键 结果 正 相 关 , 那 么 , 它 就 是 相关 变量 。 排 除 原则 指 ,如 果 个 案 任何 自 
变量 的 取 值 都 预测 关键 结果 不 发 生 , 那 么 ,这 些 个 案 就 是 无 关 个 案 。 这 一 原则 
应 该 在 纳入 原则 之 前 执行 。 

第 五 ,对 历史 来 源 的 “有 偏 ” 选 择 。 最 后 ,不 准确 地 使 用 “作为 数据 库 的 历史 ” 
来 检验 假设 ,同样 会 导致 选择 性 偏差 。 问 题 在 于 二 手 历史 数据 的 选择 。 比 较 政 
治 社会 学 依赖 历史 学 家 的 数据 工作 ,因为 他 们 使 得 “过 去 事件 已 可 直接 编码 ” 
(Lustick, 1996:605)。 然 而 ,在 比较 历史 社会 学 家 那里 ,对 于 如 何 使 用 二 手 经 验 
证 据 并 无 共识 CSkocpol，1984a:382) 。 

历史 数据 在 过 去 的 事件 上 隐 含 内 在 的 理论 。 研 究 者 面 对 这 种 风险 会 倾向 
于 选择 这 样 的 数据 来 源 :在 其 中 总 能 发 现 那些 与 其 理论 或 分 类 “合拍 ”从 而 对 他 
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们 最 有 用 的 事件 。 这 种 风险 的 实质 是 把 研究 者 的 “理解 ”当做 “事实 ”来 解释 历 
史 事件 与 过 程 。 在 许多 情况 下 ,社会 学 家 “享受 那 种 在 历史 的 糖果 店 里 “ 精 挑 细 
选 ? 的 愉悦 与 自由 ”(Goldthorpe，1991:225; Goldthorpe，1994) 。 

关于 “什么 是 历史 事实 ”的 争吵 是 个 老 问题 了 (Carl Becker, 1926), 主要 争 
论 它们 是 被 发 现 的 还 是 被 建构 的 ,是 客观 的 还 是 主观 的 。 马 克 斯 。 韦伯 和 利 奥 
KGB + + 兰 克 (Leopold von Ranke) 提 出 一 个 “科学 ”分 析 历 史 文献 和 档案 的 
方法 。 这 在 第 二 次 世界 大 战 后 的 法 国 社会 史学 的 年 鉴 学 派 那 里 得 到 了 继承 。 

解决 历史 数据 有 偏 性 的 方法 只 有 依靠 自觉 和 严谨 的 态度 ,把 选择 特定 类 型 
数据 的 理论 选择 明确 提出 来 , 且 尽 可 能 放宽 理论 选择 的 范围 ,以 避免 任何 偏差 ， 
尤其 是 要 对 不 同 数据 来 源 之 间 的 重合 地 带 进行 识别 (Lustick, 1996:613 一 616)。 


变量 与 属性 空间 


测度 的 层级 


测度 层级 在 社会 科学 中 主要 被 分 为 : (1) 名 义 的 、 二 分 的 或 者 定 类 的 变量 
(例如 ,不 同类 型 的 家 庭 结 构 : 核 心 家 庭 、 无 子女 家 庭 . 单 亲家 庭 、 扩 大 家 庭 等 等 ); 
(2) 定 序 变量 (例如 ,国家 的 国际 角色 : 强 、 有 影响 、 弱 、 不 显著 );(3) 间 距 或 比例 变 
量 (例如 ,国民 生产 总 值 及 人 均 国民 生产 总 值 \ 年 龄 .工资 党员 身份 等 等 )。 前 两 
个 层级 的 测度 常 被 称 为 “定性 的 ”, 而 第 三 个 测度 则 被 认为 是 “定量 的 ”。 第 三 个 
层级 测度 不 仅 允 许 我 们 建立 个 案 间 的 “多 或 少 ”, 还 允许 比较 它们 的 “多 多 少 ”。 

大 规模 研究 设计 涉及 大 量 个 案 , 且 定 量 的 变量 最 适 于 使 用 统计 方法 来 处 
理 。 当 然 , 统 计 方法 也 可 以 处 理 名 义 的 、 二 分 的 、 定 类 的 变量 ,只 要 个 案 数 目 够 
大 。 然 而 ,如 果 定 量变 量 的 个 案 数 目 有 限 ,那么 定量 变量 之 间 的 关系 也 是 有 问 
题 的 。 正 因 如 此 ,有 时 ,定量 变量 被 降格 为 多 分 类 变量 (两 类 就 是 二 分 变量 或 更 
多 类 别 ), 从 而 可 以 应 用 密 尔 法 和 布尔 代数 。 这 同样 适用 于 名 义 或 定 类 变量 。 
同时 ,在 有 些 情 况 下 ,我 们 对 某 一 因素 是 不 是 另 一 现象 发 生 的 充分 或 必要 条 件 
更 感 兴趣 。 在 此 情况 下 , 密 尔 法 和 布尔 代数 都 更 有 用 。 这 要 求 测度 的 层级 被 改 
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变 , 即 降格 为 二 分 变量 , 亦 即 二 元 的 ( 取 值 为 0 或 1),1 表示 某 给 定 属性 成 立 , 而 
0 表示 不 成 立 。 属 性 的 成 立 与 不 成 立 遵循 定性 和 离散 的 逻辑 , 而 非 根据 程度 和 
大 小 的 定量 /连续 的 逻辑 。 

把 定量 或 定 序 变量 降格 成 定 类 层次 有 两 个 主要 问题 。 首 先 , 在 把 间距 或 比 
例 变量 (比如 ,人 均 国民 生产 总 值 ) 转 化 成 多 分 类 变量 时 ,存在 信息 丢失 。 从 下 
表 中 ,我 们 看 不 出 西班牙 .意大利 和 希腊 的 具体 差别 是 多 少 ( 事 实 上 ,分 别 接近 
15000 美 元 .18000 美 元 和 12000 美 元 ) 。 其 次 ,为 建立 分 类 ,研究 者 需 选择 临界 点 ， 
而 这 一 选择 对 要 检验 的 关系 有 重大 影响 (参见 上 文 对 偏差 的 讨论 ,并 参见 第 7 章 
对 临界 点 的 讨论 )。 








人 均 国 民生 产 总 值 水 平 ($ ) 
国 家 
0 一 10000 10000 一 一 20000 20000—30000 30000 一 45000 
西班牙 0 1 0 0 
意大利 0 1 0 0 
希 腊 0 1 0 0 





相反 ,对 定 序 变量 而 言 ,并 没有 信息 丢失 。 对 每 一 个 类 别 ( 比 如 ,国家 影响 
力 水 平 ) 而 言 ,在 每 一 个 国际 影响 力 的 水 平 上 ,每 一 个 案 都 被 赋值 为 0 或 1。 








国际 角色 
国家 (个 案 ) - 
强 有 影响 弱 不 显著 
冰岛 0 0 0 1 
美国 1 0 0 0 
俄国 0 1 0 0 


小 样本 设计 使 用 这 种 形式 的 数据 ,并 用 密 尔 法 和 布尔 代数 来 检验 诸如 “ 强 
国际 角色 ”存在 与 否 或 处 于 国民 生产 总 值 4 个 类 别 中 的 哪 一 类 ,是 否 代表 了 某 个 
现象 发 生 与 否 的 必要 或 充分 条 件 。 


过 度 决 定 与 “自由 度 ” 


如 上 所 述 ,许多 “比较 的 ”分 析 面 临 的 问题 是 样本 数量 少 ,同时 变量 数目 太 


iat 
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多 。 这 一 “变量 太 多 ,样本 太 小 ”问题 (Barton，1955; Lijphart，1971) ,意味 着 可 
用 于 检验 潜在 相关 变量 的 个 案 过 少 ,也 就 是 存在 过 度 决定 或 缺乏 “自由 度 ” 问 题 
(Campbell，1975) {11 

有 两 个 主要 方法 可 解决 “变量 太 多 ,样本 太 小 ”的 问题 。 

方法 之 一 是 增加 样本 的 数量 。 利 普 哈 特 提出 了 这 一 点 ,同时 他 又 注意 到 个 
案 越 多 ,属性 空间 就 越 大 (变量 数量 越 多 )(Lijphart，1971)。 这 就 是 比较 研究 中 
的 著名 悖 论 :增加 个 案 数量 的 同时 , 带 来 了 更 大 的 属性 空间 ,从 而 导致 需要 再 纳 
人 更 多 个 案 来 弥补 属性 空间 的 增 大 所 带 来 的 麻烦 。 

方法 之 二 是 降低 变量 数量 。 这 一 研究 设计 在 降低 理论 上 相关 的 变量 数量 
方面 起 了 重要 作用 (King, Keohane & Verba, 1994, 1995:119—120) [12] 另 外 
3 种 方法 是 :(1) 关 注 相似 个 案 。 选 择 那 些 在 尽 可 能 多 的 重要 属性 上 取 值 相似 的 
个 案 ,这 样 就 可 以 控制 大 量 的 变量 (这 些 变量 都 被 排除 出 分 析 ) 呈 。 降 低 变异 的 
范围 意味 着 控制 ,进而 排除 变量 。 而 增加 总 的 控制 变量 数量 ,就 降低 了 出 现在 
解释 模型 中 操作 变量 的 数量 ( 因 变 量 和 自 变 量 )。 然 而 ,选择 相似 个 案 的 副作用 
是 降低 个 案 数 量 。 这 是 悖 论 的 另 一 个 方面 :相似 的 个 案 总 是 少 于 相 异 的 个 案 
(Lijphart，1971:687)。(2) 关 注 “ 关 键 ” 变 量 。 这 一 解决 方法 采用 简洁 的 解释 模 
型 ,利用 尽 可 能 少 的 自 变量 。 而 哪些 “关键 ”变量 必须 被 纳入 模型 ,又 是 研究 者 
主观 决定 的 。 比 较 法 与 其 他 方法 一 样 ,只 有 当 个案 数 量 允 许 时 ,才能 承受 引入 
大 量变 量 。(3) 合 并 变量 。 在 “因子 分 析 ” 视 角 下 ,可 根据 其 内 在 属性 ,把 两 个 及 
两 个 以 上 的 变量 合并 成 一 个 变量 ,从 而 减少 变量 的 数量 。 





如果 相似 个 案 在 很 多 自 变量 上 取 值 相同 , 即 不 起 作用 , 那 就 自然 被 排除 。 一 一 译 者 注 
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第 5 章 | 控制 


ee Re Be ee cag a Re ee hs aa ee 


这 一 章 主 要 处 理 两 个 相关 议题 。 首 先 讨论 个 案 的 可 比 性 。 其 次 讨论 如 何 
降低 和 消除 “第 三 ”变量 对 自 变 量 和 因 变 量 关 系 的 可 能 影响 , 即 研 究 者 希望 控制 
的 那些 变量 的 影响 。 分 类 与 分 组 处 理 同时 涉及 这 两 个 事项 ,因此 ,我 把 它们 放 
在 一 起 ,单独 作为 一 章 处 理 。 


可 比 性 : 比较 的 界限 


比较 研究 者 经 常 遇 到 的 问题 是 ,什么 是 以 及 什么 不 是 比较 。 与 此 相关 的 是 
比较 的 界限 以 及 使 个 案 可 比 的 策略 。 

比较 有 无 逻辑 界限 ?是 否 有 些 事物 “过 于 不 同 ” 以 致 不 可 比 , 从 而 不 能 被 纳 
和 同一 研究 设计 中 ? 或 者 正 相 反 ,“ 所 有 事物 都 是 可 比 的 ”?” 是 否 可 以 比较 美国 
的 总 统 选举 和 亚马逊 丛林 中 部 落 首领 的 选举 ? 可 比 性 这 一 问题 具有 重要 意义 。 
有 一 派 历 史学 方法 试图 把 所 有 现象 当做 独特 的 。 这 假定 的 “独特 性 ”使 得 事件 
不 可 比 。 由 此 演化 出 来 的 比较 方法 有 时 采取 “种 族 中 心 主义 ”的 立场 , 即 认为 在 
既定 社会 /时 点 框架 下 发 展 出 来 的 概念 并 不 适用 于 其 他 个 案 , 关 于 特定 社会 的 
知识 并 不 能 应 用 于 其 他 社会 。 

正如 第 1 章 的 定义 ,使 用 比较 法 时 ,我 们 并 不 直接 比较 两 个 及 两 个 以 上 的 个 
案 。 我 们 比较 的 是 从 每 个 个 案 中 抽取 的 共同 属性 的 取 值 。 让 我 们 举 一 些 社会 
科学 不 同 分 支 领 域 的 陈述 为 例 :城郊 的 犯罪 率 比 市 中 心 高 ;新 政府 的 福利 政策 
比 上 届 政 府 的 更 受 限制 ;巴西 的 选举 系统 比 阿根廷 的 更 偏向 比例 制 。 

首先 ,每 条 陈述 都 有 两 个 对 象 (个 案 ) :城市 地 区 (城郊 与 市 中 心 ) .政府 (新 政 
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府 与 上 届 政 府 ) .选举 系统 (巴西 的 与 阿根廷 的 )。 其 次 ,每 条 陈述 都 有 各 对 象 共 
享 的 一 条 属性 :犯罪 率 、 福 利 政策 .选举 系统 比例 制 水 平 。 

在 第 一 个 例子 中 ,我 们 比较 的 是 城郊 和 市 中 心 的 犯罪 率 ( 被 操作 化 为 报警 
的 犯罪 案件 数量 )。 在 第 二 个 例子 中 ,福利 政策 的 “慷慨 性 ”可 以 通过 保健 福利 
金 . 养 老 金 . 失 业 救 济 等 来 测量 。 在 第 三 个 例子 中 ,我 们 没有 直接 比较 选举 系 
统 ,而 是 比较 它们 的 代表 比例 。 巴 西 的 加 拉 赫 最 小 二 乘 非 比例 指标 是 3. 70, 而 
阿根廷 则 是 13. 5。 因 此 ,巴西 的 选举 系统 确实 比 阿根廷 的 更 偏向 比例 制 。 

因此 ,可 比 性 问题 是 一 个 共享 属性 的 问题 。 我 们 比较 的 其 实 是 个 案 在 一 些 
共享 属性 上 的 取 值 。 从 方法 论 角 度 讲 , 比较 并 无 界限 ,确实 是 可 以 比较 美国 总 
统 和 部 落 酋 长 的 任期 长 短 。 前 者 是 4 年 (可 连任 一 次 ), 后 者 是 终身 制 。 还 可 以 
比较 它们 的 选拔 :是 通过 选举 还 是 根据 出 身 。 当 比较 共同 属性 取 值 时 (任期 、 选 
举 方法 ) ,测度 层级 可 以 是 名 义 的 、 定 序 的 ,或 定量 的 。 在 比较 福利 慷慨 性 时 , 取 
值 就 是 定量 的 ;在 比较 国家 首脑 的 选拔 时 , 取 值 就 是 名 义 变量 。 


分 类 处 理 


由 此 ,个 案 间 的 可 比 性 通过 共享 一 些 属性 或 性 质 而 实现 。 如 果 个 案 A， 
B, =, N 均 有 属性 X, 则 其 取 值 (0、1、2 等 等 ) 就 是 可 比 的 。 可 比 性 可 通过 找到 
个 案 之 间 的 “公分 母 ”而 实现 。 正 如 萨 托 利 指出 的 ,“ 比 较 就 是 “同化 ”, 即 在 表面 
差异 之 外 发 现 更 深 或 更 根本 的 共同 点 ”(Sartori, 1970:1035)。 

逻辑 控制 过 程 的 第 一 步 是 概念 化 , 即 通过 定义 经 验 普遍 性 使 个 案 可 比 (Sar- 
tori,1970、1984a、1991)。 经 验 普遍 性 是 定义 那些 被 比较 个 案 共 有 属性 的 概念 
或 者 分 类 。 通 过 “用 变量 替代 个 案 名 字 ”, 就 可 以 把 单个 的 历史 观测 值 变 成 可 比 
的 个 案 (Przeworski & Teune, 1970:25; Collier，1991a、1991b) 。 

这 说 明 ,为 何 纯粹 的 “个 案 取向 ?方法 不 可 持续 。 比 较 隐 含 了 用 变量 思考 、 
属性 和 性 质 。 如 果 这 一 步 缺 失 了 ,那么 比较 就 不 可 能 :整体 论 导致 了 一 个 清晰 
且 直 接 的 矛盾 :只 有 不 可 比 的 是 可 比 的 .”(Zeldtich，1971:276) 如 巴尔 托 利 尼 提 
出 的 那样 ， 个 案 不 能 作为 “整体 进行 比较 ,只 有 识别 共同 属性 ,比较 才 有 可 能 ” 
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(Bartolini, 1993:137; Goldthorpe，1997a:2 一 4) 。 

所 请 的 “变量 取向 ”和 “个 案 取 向 ”方法 ,前 者 主要 依赖 统计 学 和 大 样本 设 
计 , 而 后 者 依赖 密 尔 法 布尔 代数 和 小 样本 设计 。 但 事实 上 ,它们 都 植 根 于 变 
量 ,并 对 变量 分 析 感 兴趣 。 这 也 再 次 强调 了 两 个 比较 传统 的 相似 性 。 


分 类 与 类 型 化 


分 类 允许 我 们 确定 哪些 个 案 是 可 比 的 (可 比 意味 着 享有 共同 属性 ) Kalle- 
berg, 1966) 。 通 过 确定 哪些 是 相似 的 ,哪些 属于 同一 群体 或 阶级 ,我 们 可 确定 
个 案 是 否 共享 一 种 属性 ,从 而 确定 它们 是 否 可 比 。 

第 一 ,等 价 。 可 比 意味 着 事物 共享 某 些 性 质 (选举 结果 .有 灵 论 者 的 仪式 )， 
即 属于 同一 个 类 别 的 个 案 。 如 果 研 究 议 会 的 选举 结果 ,我 们 必须 首先 确定 哪些 
国家 该 被 纳入 而 哪些 不 应 该 。 如 果 研 究 有 灵 论 仪式 ,我 们 必须 确定 哪些 国家 有 
有 灵 论 仪式 ,而 哪些 国家 没有 。 可 比 就 是 某 些 事物 有 一 定 程 度 的 相似 性 ,它们 
就 都 属于 由 某 共 享 属性 所 界定 的 群体 。 为 作出 明确 区 分 ,我 们 必须 清楚 地 定义 
“选举 结果 ”和 “有 灵 论 仪式 ”。 概 念 或 类 别 必须 对 所 有 纳入 比较 的 个 案 具 有 相 
同 含义 .L13] 类 别 必 须 是 等 价 的 (van Deth，1998)。 比 如 , “选举 结果 ” 指 的 是 自 
由 的 、 周 期 性 的 、 正 确 的 .通过 全 民 投 票选 举 议会 的 选举 ,上 且 这 种 议会 由 一 个 以 
上 党 派 参加 并 提名 候选 人 ,上 且 有 多 种 的 信息 来 源 .L14] 

在 考察 属性 成 立 与 否 之 前 ,或 在 按 某 些 变量 对 个 案 排 序 及 对 其 进行 测量 之 
前 ,我 们 “必须 形成 那个 变量 的 概念 ”(Lazarsfeld & Barton，1951:155)。 概 念 
或 类 别 绝 不 能 是 模糊 的 , 即 它们 必须 总 能 指明 它们 指向 的 是 哪些 经 验 事实 。 我 
们 总 是 应 该 明确 地 陈述 概念 的 经 验 指示 物 :“ 选 举 结果 ,我 们 指 的 是 一 系列 的 经 
验 指示 物 .” 只 有 这 样 ,才能 说 某 个 个 案 是 否 真 的 是 选举 个 案 。 换 句 话 说 ,只 有 
通过 明确 的 概念 ,我 们 才能 确定 这 些 个 案 是 否 共享 同样 的 属性 ,进而 最 终 建 立 
它们 的 可 比 性 。 如 果 这 一 概念 或 类 别 的 含义 是 精确 的 , 则 其 识别 能 力 就 得 到 了 
加 强 , 即 它 可 依据 精确 的 边界 ,把 一 系列 的 个 案 归 人 各 个 类 别 中 去 。 这 对 数据 
收集 有 重大 的 影响 。 概 念 和 类 别 是 “数据 容器 ”, 为 增加 它们 的 辨别 效力 ,其 定 
义 必须 能 明确 指示 哪些 个 案 可 归 入 某 类 。 只 有 当 “ 政 治 暴 力 ” 这 一 概念 在 智利 
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和 加 拿 大 具有 相同 含义 时 ,我 们 才能 比较 两 国 的 政治 暴力 水 平 。 如 果 在 智利 ， 
政治 暴力 的 经 验 指 示 物 是 杀人 、 绑 架 和 街头 暴力 ,而 在 加 拿 大 则 指 的 是 静坐 搞 
议 .示威 运动 和 对 政治 领袖 的 口头 攻击 ,那么 这 两 个 个 案 是 不 能 比较 的 。 

第 二 ,分 类 人 逻辑。 分 类 是 概念 形成 过 程 中 最 重要 的 程序 :“ 它 是 科学 中 概念 
形成 最 基本 的 方式 。 如 果 没 有 分 类 ,那么 ,无 论 是 比较 ,还 是 精确 地 测量 ,都 不 
可 能 实现 …… 只 有 作出 分 类 后 ,才能 进行 比较 ,”(Kalleberg，1966:73、75)“ 简 
言 之 ,被 比较 的 两 个 对 象 必 须 属于 同一 个 类 别 一 一 它们 或 具有 或 没有 某 种 属 
性 。 当 且 仅 当 它 们 具有 这 种 属性 ,它们 才能 被 比较 ,我 们 才能 判断 它们 之 中 哪 
个 的 属性 多 一 点 或 少 一 点 。”(Kalleberg, 1996:76) 

依照 贝 利 的 定义 ,分 类 是 一 个 一 般 性 过 程 ,也 是 结果 ,把 个 案 按照 相似 性 进 
行 归 类 。 在 建立 群 或 类 时 ,我 们 希望 最 小 化 组 内 差异 ,同时 最 大 化 组 间 差 异 。 
相似 性 因素 定义 了 哪些 对 象 属于 同一 个 类 别 ( 属 ) ,差异 性 因素 则 定义 了 如 何 区 
分 这 些 类 别 (种 、 亚 种 )D。 

对 概念 的 分 类 操作 有 3 个 基本 原则 :(1) 分 类 维度 。 分 类 需 根据 外 在 标准 来 
设置 组 别 。 各 组 别 可 按 单一 维度 或 属性 ( 单 维度 ) ,或 根据 多 个 维度 (多 维度 ) 划 
分 。“ 类 型 学 ”这 一 术语 指 的 是 多 维度 分 类 ,其 中 ,各 个 类 别 根据 概 念 而 非 经验 
(分 类 学 ) 进 行 区 分 。(2) 互 斥 性 。 每 个 项 目 ( 个 案 ) 只 能 对 应 一 个 类 别 。 不 能 有 
任何 个 案 同时 属于 两 个 以 上 类 别 。 如 果 分 类 由 一 组 互 斥 类 别 组 成 , 那 就 不 至 于 
重合 。(3) 穷 尽 性 。 每 个 个 案 都 必须 被 归 人 某 一 类 别 , 不 能 有 任何 个 案 无 法 归 
类 。 如 果 类 别 是 穷尽 性 的 ,那么 每 个 个 案 都 会 落 在 某 个 变量 的 一 类 中 。 问 题 
是 ,如 果 每 个 个 案 都 需要 有 一 个 类 别 ,那么 会 有 太 多 类 别 。 为 了 避免 这 种 情况 ， 
有 时 ,我 们 会 设置 一 个 “无 ?或 “其 他 ”这 样 的 类 。[15] 

小 样本 比较 研究 的 特性 之 一 就 是 更 广泛 地 使 用 分 类 法 。 它 在 比较 法 中 的 
确 非常 关键 。 然 而 ,分 类 法 在 其 他 方法 中 同样 重要 ,尤其 在 基于 定量 变量 和 统 
计 技 术 的 大 规模 比较 中 。 

分 类 法 先 于 统计 学 ,而 非 外 在 于 统计 学 。 概 念 形成 指向 的 差别 更 多 是 性 质 





© 属 (genus) 和 种 (species) 是 生物 学 分 类 法 中 的 两 个 级 别 。 一 一 详 者 注 
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的 ,而 非 程度 的 (Sartori，1970:1036)。 由 一 般 到 具体 的 分 类 学 等 级 ,直接 触及 
了 类 别 从 属 关系 和 分 类 原则 。 因 此 ,定量 逻辑 的 分 类 法 是 从 顺序 和 性 质 那 里 发 
展 而 来 的 。 等 级 逻辑 属于 分 类 学 。 在 能 够 使 用 "多 于 ”( 盖 ) 和 " 少 于 ”( 所 ) 等 符号 
之 前 ,我 们 必须 建立 “等 于 ”二 =) 和 “不 等 于 ”( 隆 )。 因 此 ,可 比 性 就 是 一 个 “什么 ” 
的 问题 ,一 个 定性 的 问题 ,不 能 被 “顺序 ?或 多少? 取代。 


概括 的 层级 


首先 ,我 们 来 谈论 一 下 概念 扭曲 。 如 果 概 念 可 以 “旅行 ”, 那 么 ,它们 就 可 应 
用 于 大 量 可 比较 个 案 。 然 而 ,不 是 所 有 的 概念 和 类 别 都 适 于 旅行 。 有 些 在 特定 
地 域 ,文化 和 社会 经 济 情境 下 发 展 起 来 的 概念 应 用 于 “新 ?个案 时 ,它们 不 一 定 
有 意义 。 在 跨国 研究 中 ,这 一 问题 尤为 突出 。“ 西 方 的 概念 ”在 世界 其 他 地 区 可 
能 具有 不 同 的 含义 。 萨 托 利 所 说 的 “适用 性 问题 "(Sartori，1970:1033) 与 “政治 
的 扩张 ?紧密 联系 , 即 自 20 世纪 60 年 代 以 来 ,社会 政治 事件 客观 数量 的 增长 和 
人 们 对 政治 事件 主观 兴趣 的 增长 。 

当 概 念 和 类 别 被 应 用 到 那些 不 同 于 最 初 催生 概念 和 类 别 的 个 案 的 新 个 案 
时 ,适用 性 问题 就 出 现 了 。 对 此 问题 ,一 个 常用 却 不 完满 的 解决 方案 是 “概念 扭 
H” (Hempel, 1952; Peters, 1998:86—93; Sartori，1970) 。 概 念 扭 曲 指 的 是 通 
过 扭曲 概念 来 使 它们 适用 于 新 个 案 。 有 时 ,为 一 组 个 案 而 发 展 出 来 的 类 别 被 扩 
展 应 用 到 额外 的 个 案 中 ,而 这 些 新 个 案 是 如 此 不 同 ,以 致 这 一 分 类 的 最 初 形式 
已 经 不 再 合适 了 ,此 时 ,概念 扭曲 就 发 生 了 (Collier & Mahon，1993) 。 

然后 ,我 们 来 看 一 下 抽象 性 的 阶梯 。 如 何 避 免 概 念 扭曲 ?首先 ,比较 研究 
应 依赖 经 验 普 遍 性 ,或 者 说 观察 性 概念 , 即 从 经 验 观察 而 非 理论 概念 (比如 ,“ 系 
统 ”“ 反 馈 ” 或 “均衡 ”) 中 进行 抽象 性 推论 。 这 些 概念 没有 经 验 指示 物 , 它 们 不 可 
能 被 操作 化 , 即 不 可 被 测量 。 其 次 ,如 果 想 增加 个 案 的 数量 ,又 要 避免 概念 扭 
曲 ,我们 就 必须 减少 经 验 概 念 的 特征 和 属性 。 这 可 以 通过 攀 疏 所 谓 的 “抽象 性 
的 阶梯 ”(Sartori，1970:1041; 1984a:24) 或 “普遍 性 的 阶梯 ”来 完成 (Collier &. 
Mahon，1993)。 在 一 个 想象 的 尺度 上 ,经 验 概念 可 被 放置 在 不 同 层级 。 它 们 在 
阶梯 上 的 垂直 位 置 取 决 于 概念 深度 与 广度 之 间 的 关系 。 
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“外 延 ? 这 类 术语 指 代 概 念 或 分 类 指 涉 的 那 组 对 象 、 现 象 .事件 或 实在 。 一 
个 概念 的 外 延 指 的 是 它 所 适用 的 那 类 “事物 ”.。 “内涵” 这 一 术语 指 代 一 个 概念 
或 分 类 的 属性 、 性 质 或 特征 。 它 们 定义 了 类 别 , 因 此 决定 了 个 案 的 归属 。 一 个 
概念 的 内 涵 是 决定 其 适用 于 哪些 "事物 ”的 一 组 属性 。 

外 延 和 内 涵 的 关系 遵从 “ 反 向 变动 ”法 则 , 即 概念 的 内 涵 越 深 , 根 据 这 一 概 
念 属性 定义 为 属于 这 一 类 别 的 “事物 ”就 越 受 限制 (Collier & Mahon, 1993), 
换 句 话说 ,一 个 概念 的 特征 名 单 越 长 且 越 丰富 ,这 一 概念 适用 的 对 象 就 越 受 限 
制 。 相 反 , 一 个 概念 的 属性 和 性 质 的 特殊 性 越 小 ,那么 ,这 一 概念 就 可 指 涉 更 多 
的 “事物 ”( 存 在 、 对 象 . 事 件 )。 


外 延 (个案 范 围 ) 





低 内 涵 (属性 范围 ) 高 


既然 “选拔 ”这 一 属性 同时 适用 于 德国 和 美国 ,那么 ,比较 两 国 行政 长 官 的 
选拔 就 是 可 能 的 。 这 两 个 个 案 共 享 了 一 种 属性 ,因此 是 可 比 的 。 然 而 ,由 于 德 
国 行政 长 官 是 由 议会 提名 ,而 非 选举 产生 的 ,就 不 能 比较 这 两 国 行政 长 官 的 
“选举 ”。 

“行政 长 官 选拔 "这 一 有 限 内 涵 的 概念 并 未 指定 属性 ,因而 适用 于 很 多 个 
案 。 相 反 , 一 个 更 深 的 内 涵 , 即 限定 更 多 属性 一 一 比如 “选民 直选 ”一 一 就 排除 
了 大 量 的 个 案 , 因 为 在 这 些 个 案 中 ,行政 长 官 或 由 议会 提名 (如 大 部 分 欧洲 民主 
国家 ) ,或 由 选举 团 间 接 选 举 出 来 (如 美国 ) 。 

有 两 种 方法 可 在 抽象 阶梯 上 往 上 息 。 一 种 是 扩大 概念 的 外 延 ( 减 少 属性 或 
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性 质 ) ,这 么 做 会 带 来 更 大 的 类 别 ,使 分 化 更 少 ,但 有 清晰 界限 和 区 分 能 力 。 这 
是 正确 的 方法 。 另 外 一 种 是 “概念 扭曲 ”, 扩 大 外 延 但 不 减少 内 涵 。 外 延 通过 模 
糊 概 念 之 间 界 限 的 方式 获得 了 扩大 (Sartori，1970:1041) 。 


家 族 相似 性 与 向 心 分 类 


在 离散 分 类 法 中 ,个 案 属 于 或 不 属于 一 个 类 别 : 它 们 或 具有 或 不 具有 一 种 
属性 (Kalleberg，1966:76)。 正 如 萨 托 利 指出 的 ,属性 的 正面 识别 在 实践 中 会 过 
于 严 苛 。 他 对 此 问题 的 答案 是 , 当 一 个 概念 的 精确 属性 无 法 确定 时 ,就 必须 清 
楚 申明 这 一 概念 不 是 什么 , 即 属性 的 反面 识别 (Sartori, 1970)。 有 人 提出 了 解 
决 离散 边界 问题 的 男 外 两 种 解决 方案 : 家 族 相似 性 和 向 心 分 类 (Collier &. 
Mahon，1993) 。[16] 

家 族 相似 性 (首先 由 语言 哲学 家 维特 根 斯 坦 提 出 ) 基 于 这 样 的 原则 :如 果 不 
存在 某 类 个 案 共 享 的 单一 属性 ,那么 ,研究 者 应 当 纳 入 那些 在 某 种 程度 上 享有 
这 种 属性 的 个 案 。 举 个 例子 ,可 这 样 定义 “民主 ”: (1) 普 选 权 (政治 权力 );(2) 新 
闻 自 由 、 结 社 自由 、 信 仰 自 由 ,个 人 保护 (民事 权力 ); (3) 自 由 的 .周期 性 的 正确 
的 选举 ; (4) 行 政 长 官 对 议会 负责 ;(5) 独 立 司法 。 

如 果 比 较 19 世纪 晚期 的 英国 法国 、 德 国 和 比利时 ,我 们 会 发 现 ,并 非 所 有 
个 案 都 共享 ”民主 ”这 一 属性 。 英 国 没 有 普选 权 , 法 国 司法 不 独立 ,德国 政府 不 
能 被 议会 罢免 。 根 据 经 典 的 分 类 ,只 有 比利时 能 被 归 人 “民主 ”这 类 。 

家 族 相 似 性 这 一 想法 考虑 到 属性 在 一 定 程 度 上 由 所 有 个 案 共 享 。 原 型 类 
别 ( 民 主 ) 是 一 个 分 析 性 的 建构 ,并 具有 启发 式 的 有 效 性 。 马 克 斯 。 韦伯 的 理想 
类 型 法 通过 分 析 来 定义 ,而 非 由 观察 到 的 经 验 个 案 的 共享 属性 来 定义 (Burger， 
1976) 。 真 实 的 个 案 与 理想 类 型 在 一 定 程度 上 共享 其 属性 ,这 意味 着 属性 设 定 了 
个 案 之 间 的 “变动 范围 >。 这 一 方法 的 优势 在 于 ,研究 者 不 会 因为 界限 的 严格 而 
舍弃 一 些 个 案 。 

向 心 分 类 (最 初 由 认 知 科学 家 勒 考 夫 提出 ) 同 样 依赖 属性 在 个 案 之 间 的 变 
动 范围 。 

首先 有 一 个 原型 或 理想 类 型 ,代表 了 完美 的 .完整 的 个 案 , 这 是 “主要 亚 
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类 ”。 而 “次 要 亚 类 ” 则 是 其 变异 。 次 要 亚 类 不 包括 主要 亚 类 的 所 有 属性 。 当 主 
要 亚 类 的 组 成 因素 被 一 个 接 一 个 拿 走 或 者 换 成 不 同 组 合 ( 但 不 完整 ) 时 , 非 中 心 
亚 类 就 产生 了 。 它 不 同 于 经 典 分 类 法 ,因为 经 典 分 类 法 有 一 个 累进 式 区 分 ， 
“ 属 ” 比 “种 ”高 一 级 ,高 级 类 和 低级 类 的 各 个 类 别 通 过 引入 更 多 不 同属 性 (种 差 )， 
使 各 自得 以 区 分 D。 而 在 向 心 分 类 法 中 ,“ 主 要 亚 类 ” 比 “ 次 要 亚 类 ”具有 更 少 的 
属性 。 

这 些 分 类 策略 为 我 们 建构 类 别提 供 了 不 同 的 解决 方案 。 这 对 可 比 性 是 有 
影响 的 , 即 影响 我 们 把 哪些 个 案 纳 入 分 析 。 


控制 与 研究 设计 


前 面 讨论 了 分 类 法 和 分 类 学 操作 对 可 比 性 的 重要 意义 ,其 实 分 类 法 还 有 第 
二 个 重要 角色 。 分 类 法 帮助 控制 变量 (Smelser，1976:167 一 174)。 这 两 个 角色 
不 应 被 混淆。 可 比 性 关注 个 案 , 而 控制 关注 变量 。 一 旦 确认 可 比 性 ,分 类 法 就 
被 用 于 排除 那些 干扰 研究 者 想得到 的 变量 关系 的 变量 一 一 这 是 降低 不 必要 变 
异 的 过 程 。 


匹配 与 随机 化 


经 验 研究 基于 现象 (或 它们 被 操作 化 之 后 的 变量 ) 之 间 的 因果 关系 假设 。 
通过 检验 经 验证 据 ,假设 或 被 确证 或 被 拒绝 。 假 设 的 经 验 验 证 隐 含 两 个 不 同 但 
相关 的 方面 :决定 现象 之 间 的 关联 , 即 原因 和 结果 的 关系 (用 操作 化 术语 来 说 ， 
即 自 变 量 和 因 变 量 之 间 的 关系 ) ;从 其 他 变量 中 ,分 离 出 每 一 个 操作 变量 独立 的 
因果 作用 。 

在 不 同 的 检验 阶段 ,同一 变量 可 作为 实验 变量 ,也 可 作为 控制 变量 ,这 取决 
于 它 是 否 被 “允许 ”变动 。 





O 经 典 分 类 法 根据 “ 属 加 种 差 ” 下 定义 。 种 差 本 身 也 是 属性 ,用 种 差 去 限制 属 的 概念 就 构成 了 
定义 项 。 比 如 ， 货 币 就 是 固定 地 充当 一 般 等 价 物 的 商品 ”。 商 品 就 是 属 , 而 货币 是 种 ,固定 充当 一 般 
等 价 物 ” 就 是 种 差 。 种 差 不 同 ,就 可 以 定义 不 同 的 亚 种。 一 一 译 者 注 
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通过 把 自 变量 转化 为 控制 变量 ,或 者 反 过 来 (当然 这 些 变量 都 必须 被 认为 
是 相关 的 ) ,调查 者 能 够 从 中 获得 信心 、 给 出 解释 完善 理论 观点 .增强 解释 力 。 
对 所 有 类 型 的 研究 而 言 , 哪 些 变量 应 当 被 控制 ,完全 是 研究 者 基于 过 往 知 识 或 
新 见解 所 作出 的 决定 。 

变量 的 控制 可 以 通过 以 下 方式 进行 : 

第 一 ,随机 化 (通过 差异 最 大 设计 进行 控制 )。 通 过 随机 化 ,差异 被 排除 了 : 
如 果 同 一 现象 可 以 在 不 同情 境 下 (不 同 的 变量 及 组 合 ) 发 生 ,那么 ,这 些 情境 的 
差异 就 对 其 现象 发 生 没 有 影响 ,因此 是 无 关 的 。 这 与 差异 最 大 设计 很 相似 , 与 
求 同 法 也 很 相似 。 差 异 最 大 设计 法 消除 了 那些 取 值 随 个 案 而 变 的 “第 三 变量 ”。 

第 二 ,匹配 (通过 差异 最 小 设计 进行 控制 )。 匹 配 把 相似 性 排除 了 : 因 变 量 
的 某 种 变化 不 可 能 由 在 所 有 个 案 中 都 保持 不 变 的 因素 引起 。 通 过 匹配 ,第 三 变 
量 的 影响 被 排除 了 ,它们 被 转化 成 常数 项 ,因此 不 代表 差异 来 源 。 这 相当 于 差 
异 最 小 设计 法 和 求 异 法 。 差 异 最 小 设计 法 消除 了 那些 在 个 案 之 间 保 持 不 变 的 
“第 三 变量 ”的 影响 。 

进行 随机 化 意味 着 选择 那些 覆盖 了 某 一 属性 整个 取 值 范围 的 个 案 。 随 机 
样本 保证 了 总 体 中 每 个 个 案 都 有 平等 的 抽 中 机 会 ,这 增强 了 我 们 进行 推论 的 信 
心 。 随 机 过 程 在 依赖 大 量 个 案 的 统计 方法 中 很 典型 。 进 行 匹配 (有 时 被 称 为 样 
本 抽样 的 “参数 化 >"“ 标 准 化 ?或 “分 层 化 ”意味 着 把 变量 转化 成 常数 ,使 其 不 再 
变动 ,从 而 令 它 们 的 影响 被 排除 , 自 变量 和 因 变 量 之 间 的 关系 也 得 以 分 离 。 

需要 指出 的 是 ,无 论 是 随机 化 还 是 匹配 ,控制 不 必要 变异 来 源 (“ 第 三 变 
量 ”) 的 技术 都 依赖 个 案 选 择 程序 , 即 最 终 依 赖 于 研究 设计 。 

在 社会 科学 中 ,研究 设计 特别 重要 ,因为 研究 者 从 既 有 数据 中 抽取 个 案 。 
在 实验 中 ,调查 者 对 数据 的 产生 有 直接 的 影响 (Cook & Campbell, 1979)。 这 是 
一 种 情境 操控 。 在 实验 室 条 件 下 ,可 把 变量 转换 成 常数 来 排除 不 必要 的 变异 来 
源 , 分 离 出 操作 变量 的 作用 。 而 无 论 是 统计 法 还 是 比较 法 ,都 不 能 对 数据 产生 
直接 的 影响 。 因 此 ,控制 就 通过 对 概念 的 操控 完成 。 调 查 者 选择 那些 在 某 个 属 
性 上 具有 相似 属性 或 那些 在 某 个 给 定 属性 上 有 不 同 取 值 (随机 化 ) 的 个 案 。 
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差异 最 小 设计 和 可 比 个 案 控制 策略 


在 比较 法 中 ,同样 作为 控制 方法 的 匹配 比 随 机 化 扮演 了 更 重要 角色 。 在 实 
验 和 统计 方法 中 ,随机 化 可 通过 操控 和 大 样本 轻易 实现 。 当 样本 量 很 小 时 , 随 
机 化 更 加 困难 。 这 意味 着 ,个 案 不 足以 涵盖 某 一 给 定 属性 或 变量 所 有 可 能 的 取 
值 范 围 。 匹 配 作 为 比较 法 中 最 主要 的 控制 技术 ,有 两 个 重要 影响 : 

第 一 ,分 类 的 角色 。 因 为 匹配 在 控制 不 必要 变异 来 源 时 扮演 重要 的 角色 ， 
因而 在 比较 法 的 概念 操作 、 分 类 和 类 型 学 中 都 变 得 很 重要 。 匹 配 的 过 程 主 要 是 
根据 给 定 属性 的 相似 取 值 把 个 案 分 组 。 要 使 一 个 变量 保持 不 变 ,必须 使 所 有 个 
案 都 在 那个 变量 上 取 值 相同 。 因 此 ,匹配 控制 是 通过 分 类 和 再 分 类 实现 的 
(Smelser，1976 :168 一 169) 。 

第 二 ,差异 最 小 设计 。 对 一 部 分 学 者 而 言 , 比 较 研究 设计 主要 包含 那些 以 
相似 性 为 特征 个 案 的 设计 。 利 普 哈 特 提出 ,“ 把 比较 方法 这 一 术语 留 给 可 比 个 
案 策略 更 为 合适 ,可 以 把 第 一 个 解决 方法 ( 即 随机 化 ) 归 入 到 统计 方法 中 ”(Li 
jphart，1975:163)。 个 案 通过 这 种 选择 方式 来 最 小 化 控制 变量 的 变异 ,最 大 化 
实验 变量 ( 自 变量 或 因 变 量 ) 的 变异 ,并 获得 更 大 的 “自由 度 ”。 

匹配 技术 最 早 在 人 类 学 中 发 展 起 来 ,并 作为 控制 比较 \ 设 定 (Holt & Turn- 
er，1970:11) ,或 系统 性 比较 例证 (Smelser，1973:53; 1976:157) 方 法 被 引入 社 
会 学 和 政治 学 中 (Eggan, 1954; Hoenigswald，1963) 。 

如 果 研 究 者 处 理 来 自 相 似 “ 地 区 ”的 个 案 , 它 们 具有 同 质 文 化 和 相似 社会 经 
济 条 件 , 则 相 比 从 不 同文 化 和 社会 经 济 情境 中 抽取 的 个 案 , 就 能 控制 更 多 因素 。 
正 因 如 此 ,这 些 作者 偏好 中 层 理论 , 即 研究 设计 在 一 般 性 上 有 限度 ,但 允许 控制 
解释 。 

通过 普 沃 斯 基 和 特 恩 的 名 作 《 比较 社会 研究 的 逻辑 》(The Logic of Com- 
parative Social Inquiry) (Przeworski & Teune, 1970; Meckstroth, 1975),“ 控 
制 比较 法 ”被 引入 比较 政治 研究 中 。 这 种 类 型 的 研究 设计 有 几 个 名 称 , 最 常用 
的 两 个 是 “差异 最 小 设计 ”(Przeworski & Teune, 1975) 和 “比较 个 案 策略 ” 
(George, 1979; Lijphart，1975)。 在 差异 最 小 设计 中 ,研究 者 比较 两 个 以 上 尽 
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可 能 相似 的 个 案 , 从 而 能 够 关注 那些 构成 关键 自 变量 和 因 变 量 关系 的 变异 。[17] 
而 这 只 是 一 种 研究 设计 。 它 关注 选择 个 案 和 变量 。 差 异 最 小 设计 与 控制 比较 
法 采取 相似 的 步骤 ,它们 都 在 同 质 情 境 下 选取 个 案 , 从 而 允许 最 小 化 “实验 变 
量 ”, 而 增加 ”控制 变量 ”。 所 选 个 案 共 有 的 情境 越 多 ,能 够 识别 到 底 哪 个 变量 能 
够 解释 因 变量 变异 的 能 力 就 越 高 。 当 然 ,这 么 做 的 风险 是 扩散 效应 会 增加 ( 参 
见 上 文 的 高 尔 顿 问题 )。 


分 类 的 作用 


下 面 的 表 以 选举 /选拔 一 国 元 首 为 例 ,明确 了 分 类 法 对 可 比 性 和 控制 有 重 
要 的 双重 角色 。 

首先 ,对 什么 是 可 比 的 而 言 , 分 类 法 不 可 或 缺 。 如 果 对 国家 元 首 的 选举 感 
兴趣 ,我们 就 必须 排除 那些 无 须 选 举国 家 元 首 的 国家 。 在 “选举 国家 元 首 ” 这 一 
属性 上 ,德国 .意大利 和 瑞士 ( 取 值 为 0) 与 法 国 .美国 .奥地利 等 国 ( 取 值 为 1) 不 
同 。 在 德国 .意大利 和 瑞士 ,国家 元 首 是 由 议会 提名 的 ,而 在 法 国 、 美 国 和 奥 地 
利 等 国 ,国家 元 首 由 人 民选 举 产生 。 因 此 ,德国 .意大利 和 瑞士 不 能 在 这 一 特定 
属性 上 与 法 国 、 美 国 和 奥地利 进行 比较 。 但 如 果 概 括 层级 提高 ,我 们 在 一 般 性 
阶梯 上 使 用 更 抽象 的 概念 (选拔 而 非 选 举 ) ,那么 这 些 个 案 又 是 可 比 的 ,所 有 这 
些 个 案 都 存在 一 个 选拔 国家 元 首 的 过 程 ( 取 值 为 1) 。 

不 可 比 个 案 是 那些 国家 元 首 无 须 选 拔 ( 取 值 为 0) 的 国家 ,比如 在 君主 立宪 
制 国家 中 ,国家 元 首 是 世袭 的 (英国 、 瑞 士 \ 西 班 牙 和 荷兰 等 )。 























概括 层级 
分 类 的 角色 
低层 级 高 层级 

可 比 性 选举 (1) 选拔 (1) 

(相同 属性 ) 无 选举 (0) 无 选拔 (0) 
直接 的 任命 的 

匹配 奥地利 法 国 、| ”间接 的 。 | 奥地利 ,法 国 、| 德国 SKA 

(相同 取 值 ) 葡萄 牙 . 爱 尔 | 美国 eo 
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其 次 ,分 类 对 匹配 变量 而 言 不 可 或 缺 。 我 们 选择 那些 具有 相同 取 值 的 个 
案 , 从 而 把 变量 变 成 常数 。 在 国家 元 首选 举 的 例子 中 ,这 一 变量 有 两 个 取 值 : 直 
接 选 举 和 间接 选举 。 在 国家 元 首选 拔 的 例子 中 ,这 一 变量 有 两 个 取 值 :选举 或 
任命 。 请 注意 ,在 低 概括 层次 上 的 “选举 是 更 高 一 级 概括 层次 上 的 名 义 变量 
“选拔 ”的 一 个 属性 。 如 果 我 们 想 考察 政党 分 化 程度 对 政府 稳定 性 的 影响 ,我 们 
需要 “控制 ?选拔 的 类 型 (选举 或 任命 ), 因为 直接 选举 国家 元 首 带 来 的 合法 性 或 
许可 弥补 政党 分 化 的 影响 。 分 类 可 以 产生 同 质 的 个 案 群 体 。 


原因 与 结 采 


本 章 处 理 比 较 方法 的 解释 目的 以 及 如 何 接受 或 拒绝 变量 间 因果 关系 假设 ， 
即 如 何 检验 它们 的 经 验 有 效 性 。 


归纳 推理 方法 


因果 关系 是 经 验 研 究 最 关心 的 问题 。 事 件 不 是 随意 发 生 的 ,而 是 在 一 定 条 
件 下 发 生 。 大 部 分 研究 处 理 的 是 事件 的 起 因 或 事件 的 影响 。 政 府 不 稳定 的 主 
要 原因 是 什么 ?什么 因素 导致 通货 膨胀 ?社会 保险 是 否 降 低 工作 效率 ?选举 
方式 从 比例 代表 制 转向 多 数 制 有 何 影 响 ? 

尽管 “原因 ”这 一 术语 非常 复杂 且 充 满 争议 ,但 它 总 是 涉及 事件 或 现象 之 间 
的 系统 性 关联 。 事 件 总 是 相互 联系 的 。 因 果 陈 述 隐 含 原因 和 结果 之 间 规 律 一 
般 的 关系 。 因 果 关 联 的 概括 是 一 种 假定 , 即 不 论 何 时 何 地 ,一 个 既定 现象 总 是 
或 通常 有 另 一 现象 紧 跟 其 后 。 

因果 关系 条 件 陈 述 的 逻辑 形式 为 "如果 (前 件 )…… 那 么 (后 件 )”。 使 用 逻辑 
符号 的 话 ,前 件 常用 p, 后 件 常 用 g 来 表示 :“ 如 果 p…… 那 么 g。” 如 果 假 设 为 真 ， 
前 件 就 蕴含 了 后 件 。 这 种 蕴含 用 符号 “ 汪 ”或 者 “一 ”来 表示 ,可 以 取代 “如 果 …… 
那么 ……” 这 种 语言 形式 :pq MA pq。 

一 个 条 件 陈述 要 么 为 真 ,要 么 为 假 ,取决 于 p 和 9g 在 真实 世界 中 存在 与 否 。 
条 件 陈述 为 真 取 决 于 p 和 g 出 现 (1) 或 缺失 (0)。 根 据 条 件 陈述 中 组 成 部 分 p 
和 9g 为 真 或 为 假 ,整个 条 件 陈 述 也 为 真 (1) 或 为 假 (0) 。 例 如 ,我们 发 现 多 数 制 选 
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举 系统 (为 真 ,1) 和 两 党 制 (为 真 ,1) 之 间 存 在 固定 关联 ,那么 这 一 条 件 陈 述 就 为 
真 (1) 。 相 反 , 如 果 我 们 发 现 多 党 制 系统 (不 存在 两 党 制 ,0) ,那么 这 一 条 件 陈 述 
为 假 (0) 。 

要 确定 因果 关系 条 件 陈 述 是 否 为 真是 一 个 经 验 研 究 问题 。 规 律 性 陈述 只 能 
通过 观察 现实 来 判断 其 真 伪 。 然 而 ,经 验 观察 总 是 被 限制 在 有 限 数量 的 事件 上 , 即 
限制 于 部 分 个 案 ,而 非 所 有 个 案 。 基 于 观察 所 得 的 .有 因果 关联 的 事实 而 作出 的 普 
遍 性 陈述 就 是 归纳 推理 。 那 么 ,如 何 从 观察 到 的 事件 中 推论 普遍 因果 关系 呢 ? 

最 古老 的 归纳 推理 是 列举 法 。 有 利于 条 件 陈述 的 证 据 确 认 某 一 陈述 。 有 
两 种 类 型 的 列举 法 :归纳 概括 和 类 推 法 。 归 纳 概括 列举 那些 可 以 帮助 确证 因果 
关联 的 事件 。 例 如 ,通过 列举 那些 低 利率 且 物 价 上 涨 的 国家 ,可 推断 “ 低 利率 导 
致 通货 膨胀 ”; 通 过 列举 那些 比例 代表 制 国家 存在 政党 分 化 的 情况 ,我 们 推断 
“比例 代表 制导 致 政党 分 化 ”。 类 推 法 推断 的 是 下 一 个 样本 ,而 非 一 个 普遍 的 规 
律 。 比 如 ,我 们 期 望 下 一 个 引入 比例 代表 制 的 国家 也 会 出 现 政党 分 化 情况 ,或 
下 一 个 降低 利率 的 国家 会 有 更 高 的 物价 水 平 。 这 两 种 列举 法 基于 同一 个 逻辑 ， 
即 印 证 这 一 关系 的 事例 越 多 ,因果 关系 成 立 的 可 能 性 就 越 大 。 

然而 ,列举 推论 受 一 个 根本 问题 的 困扰 , 即 只 需 一 个 反面 事例 ,就 可 推翻 整个 规 
律 。 对 列举 推论 及 类 推 法 作为 归纳 概括 方法 的 批评 ,首先 由 弗朗西斯 培根 在 (新 工 
有 具 XThe New Organon) 一 书 中 正式 提出 。 在 书 中 ,他 提出 了 其 他 几 种 归纳 程序 以 取 
代 列 举 法 (基于 亚 里 士 多 德 逻 辑 ), 后 来 , 密 尔 把 这 些 精细 化 ,并 重新 表述 。 这 些 程序 
被 称 为 " 密 尔 归纳 推理 法 ”。 如 下 文 将 要 讨论 的 ,今天 大 家 使 用 的 这 些 方法 是 由 科恩 
和 内 格 尔 、 汉 … 赖 特 , 波 普 、 享 普尔 和 奥 本 海 姆 在 此 基础 上 发 展 的 ,他 们 都 强调 其 排除 
性 本 质 , 即 条 件 陈述 或 假设 只 要 未 被 拒绝 或 证 伪 , 就 可 被 认为 是 真 的 (Cohen & 
Nagel, 1934; von Wright, 1951; Popper, 1959; Hempel & Oppenheim, 1948), 


RH AER 


基于 事件 的 出 现 (1) 或 缺失 (0) ,我 们 有 可 能 建构 一 个 条 件 陈 述 真 值 表 , 在 此 
表 中 ,所 有 可 能 组 合 ( 工 一 W ) 决 定 了 条 件 陈述 的 真 假 , 便 于 我 们 决定 是 接受 还 
是 拒绝 假设 。 蕴含 (一 ) 一 栏 的 符号 告诉 我 们 这 一 条 件 陈 述 为 真 (1) 或 为 假 (0)。 
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p Eá q 
I 1 1 1 
I 1 0 0 
I 0 1 l 
NV 0 1 0 


FABRA BB) E p 和 g 真 假 的 一 个 函数 。p 和 g 的 4 种 可 能 组 合 是 
d, 1), d, 0), (0, DACO, 0)。 正 如 表 中 出 现 的 那样 ,除了 组 合 卫 ,这 一 条 件 
总 是 为 真 。 排 除 性 过 程 正 是 基于 组 合 工 ,因为 它 直接 导致 假设 被 拒绝 。 

组 合 工 意味 着 ,如 果 p AA) ,同时 gq 也 为 真 (1) ,那么 关系 为 真 。 组 合 工 
表示 ,如 果 p HA) (Ag 为 假 (0) ,那么 关系 不 成 立 。 组 合 焉 表示 ,即使 p 为 
假 (0) ,但 a 依然 可 为 真 (1) ,因为 它 可 由 其 他 因素 引起 (“多 重 因果 ”原则 )。 组 合 
K 意味 着 ,即便 p 为 假 而 g 也 为 假 , 但 关系 依然 存在 。 


充分 与 必要 条 件 


对 布尔 代数 方法 而 言 , 一 个 重要 特点 是 原因 或 事件 发 生 的 条 件 或 是 必要 
的 ,或 是 充分 的 (Mackie, 1965; Mahoney, 2004), 

充分 条 件 是 条 件 p 成 立时 ,g 总 成 立 。 如 果 出 现 这 类 条 件 ,那么 ,9 总 会 出 
现 。 根 据 上 面 的 真 值 表 ,此 时 z 三 1, g 王 1( 组 合 I), 且 没有 任何 个 案 属 于 组 合 
Bl p=1,¢=0), 4g 的 发 生 也 可 能 由 其 他 原因 造成 (组 合 亚 ), 即 p == 
0,q=1. HAZM p 出 现时 ,gq 总 是 出 现 ; 只 要 zp 出 现 ,gq 就 从 不 缺失 。 此 时 ,p 
就 是 g 的 充分 条 件 。 用 贝 叶 斯 概率 符号 来 表示 ,就 是 : 

P(p|q =1, Pip |~q =00 








O 原文 公式 如 此 。 作 者 习惯 统一 把 原因 迎 或 C 放 在 条 件 竖 杠 的 左边 ,而 把 结果 9 RE E 放 在 
条 件 竖 杠 的 右边 , 通 篇 如 此 。 充 分 条 件 时 ,尽管 p 在 条 件 竖 杠 左边 ,但 p 代表 条 件 ,这 与 条 件 概率 公式 
应 当 把 条 件 放 在 竖 杠 右边 的 习惯 不 同 。 而 在 表述 必要 条 件 下 ,gq 代表 条 件 , 此 时 与 一 般 条 件 概 率 公式 
的 写作 方式 相同 。 同 样 是 公式 P(p | D) = 1, 在 充分 条 件 时 ,应 读 成 “p 成 立时 ,gq 成 立 的 概率 为 1”; 而 
在 必要 条 件 时 , 则 读 成 “g 成 立时 ,p 成 立 的 概率 为 1”。 P(p 1 一 9) 二 0 在 充分 条 件 时 读 成 “p 成 立时 , 非 
gq 发生 的 概率 为 0”。P( 一 p19) 在 必要 条 件 时 表示 “gq 发 生 时 , 非 p 成 立 的 概率 为 0”。 这 在 一 定 程度 上 
会 引起 读者 的 困扰 。 但 为 保证 行文 的 格式 统一 ,在 此 保留 了 原文 的 公式 写作 方式 。 因 此 ,请 读者 注 
意 ,在 充分 条 件 时 ,应 当 从 左 往 右 读 公式 ,而 在 必要 条 件 时 , 则 从 右 往 左 读 公式 。 这 恰好 与 充分 条 件 
(p>q) 和 必要 条 件 (p<-q) 的 箭头 方向 一 致 。 一 一 译 者 注 
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必要 条 件 是 当 事 件 p 不 出 现时 ,事件 g 不 会 发 生 。 事 件 g SHNA p 出 现 
时 才 发 生 , 即 当 g = 1 时 , p= 1 (组 合 I), 同 时 不 会 有 任何 一 个 一 p 个 案 , 即 不 
ZEM p= 0, q=1 (组合 肯 ) 的 情况 。 简 言 之 , 当 g 发 生 时 ,p 总 是 出 现 ,此 时 ， 
pp 是 gq 的 必要 条 件 。 用 贝 叶 斯 概率 符号 表示 ,就 是 : 





P(p|q =1,P(~ p|q@ =0 


条 件 陈 述 可 以 反 转 或 转化 。 如 果 p 是 gq 的 充分 条 件 , 那 么 9 就 是 p 的 必要 
条 件 。 在 条 件 陈 述 p>g 中 ,p 是 g 的 充分 条 件 ,g 是 p 的 必要 条 件 ( 如 果 p 和 gq 
AAA), Ap 出 现 ,gq 就 出 现 。 这 两 种 情况 都 导致 P(p 19g) 二 1( 组 合 1)。 
如 布 劳 莫 勒 和 戈 茨 指出 的 ， 任 何必 要 条 件 假设 都 可 以 转化 成 一 个 充分 条 件 假 
设 , 反 之 亦 成 立 ”(Braumoeller & Goertz，2000:846) 。 如 果 不 平等 是 政治 不 稳 
定 的 充分 条 件 ,那么 ,政治 不 稳定 就 是 不 平等 的 必要 条 件 。 然 而 ,这 会 造成 混 
消 , 因 为 不 稳定 发 生 在 不 平等 之 后 。 

首先 ,我 们 必须 区 分 必要 条 件 和 必要 原因 。 尽 管 所 有 结果 都 是 其 充分 原因 
的 必要 条 件 , 但 它们 未 必 总 是 必要 原因 。 必 要 原因 是 必要 条 件 的 一 个 子 集 。 原 
因 总 是 发 生 在 结果 之 前 。 因 此 ,我 们 必须 区 分 成 为 某 个 原因 之 结果 的 “有 效 ” 必 
要 条 件 和 导致 某 种 结果 的 “因果 ”必要 条 件 。 

其 次 ,必须 区 分 相关 与 琐 细 必要 条 件 。 存 在 议会 是 选举 候选 人 的 必要 条 
件 , 却 是 科学 进步 的 琐 细 和 无 用 的 条 件 。 布 劳 莫 勒 和 戈 获 区 分 了 必要 条 件 方法 
的 两 个 步骤 (Braumoeller & Goertz，2000) 。 第 一 步 确 定 某 事件 是 不 是 必要 条 
件 ( 如 果 不 是 ,第 二 步 就 无 关 了 )。 如 果 是 必要 条 件 , 那 么 此 事件 是 相关 的 还 是 
琐 细 的 必要 条 件 。 

总 而 言 之 ,如 果 p 是 g 的 充分 条 件 ,那么 ,p 蕴含 了 gq, 或 说 gq 被 p AS. p 
>q 或 pg。 例如 ,在 比例 代表 制 下 ,获得 最 多 选票 是 当选 的 充分 条 件 但 并 非 
必要 条 件 , 因 为 选票 数量 第 二 和 第 三 的 候选 人 也 能 当选 。 如 果 p 是 g 的 必要 条 
件 ,那么 ,p 被 g 蕴 含 ,或 g 蕴 售 了 Pp。p<-q 或 pCgq。 例如 ,在 两 轮 选 举 系统 
下 ,在 第 一 轮 获得 最 多 选票 是 当选 的 必要 条 件 但 不 是 充分 条 件 , 因 为 只 有 在 
第 一 轮 或 第 二 轮 获 得 50% 以 上 的 选票 ,才能 当选 。 
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如 果 p 是 gq 的 充分 必要 条 件 , 那 么 ,p 弄 含 了 gq, 上 且 同 时 被 g BAT RI, 
即 p=q 或 pq。 这 被 称 为 “等 价 ” 或 “ 互 为 条 件 ”。 例 如 ,在 多 数 制 下 ,获得 最 多 
选票 是 当选 的 充分 必要 条 件 。 


我 们 从 讨论 密 尔 法 以 及 普 沃 斯 基 和 特 恩 的 差异 最 小 和 差异 最 大 设计 开始 ， 
并 且 认为 定量 的 /统计 的 和 定性 的 /布尔 代数 的 方法 都 基于 此 。 定 性 的 /布尔 代 
数 的 方法 基于 密 尔 三 法 或 归纳 推理 方法 (Skocpol, 1984a:378; Zeldtich, 1971; 
267) 一 一 求 同 法 , 求 异 法 \ 求 同 求 异 并 用 法 。 而 定量 的 /统计 的 方法 则 是 基于 共 
变法 (尽管 按照 密 尔 的 看 法 ,所 有 方法 最 终 都 根源 于 求 异 法 )。 


求 同 法 


密 尔 这 么 定义 求 同 法 : 


如 果 两 个 以 上 事件 只 有 一 个 条 件 相 同 ,那么 这 一 所 有 个 案 都 具有 的 条 
件 就 是 既定 现象 的 原因 (或 结果 )。(Mill, 1875:451) 


研究 者 希望 能 够 解释 在 所 有 个 案 (E) 中 都 存在 的 条 件 。 如 果 这 些 事 件 在 若 
干 可 能 的 前 件 条 件 中 ,只 有 一 个 共同 前 件 D(C) ,那么 这 一 所 有 个 案 都 具备 的 前 
件 就 是 现象 的 原因 (或 结果 ) 118] 

此 类 型 分 析 可 用 下 表 表 示 (1 表示 条 件 成 立 ,0 表示 不 成 立 )， 

假设 有 5 次 社会 革命 事件 (E) ,研究 者 希望 发 现 革 命 发 生 的 原因 (C) 。 
在 这 些 可 能 的 原因 中 ,有 不 平等 的 阶级 结构 (Cl ) .威权 政治 体制 (Cz )、 弱 国 
际 地 位 (C3)、 低 财富 水 平 (C4 ) ,战争 失利 (Cs ) 及 其 他 (Cn )。 在 这 5 次 革命 





中 ”前 件 (antecedent) 是 假 言 判断 中 规定 条 件 的 判断 。 后 件 (consequent) 是 假 言 判 断 中 反映 依赖 
于 某 种 条 件 的 事物 情况 的 判断 。 如 在 “如 果 战 争 失利 ,就 会 发 生 社 会 革命 "中 ,战争 失利 ”就 是 前 件 ， 
“发 生 社会 革命 ”就 是 后 件 。 一 一 译 者 注 


基于 布尔 代数 的 比较 法 导论 











5 
a 潜在 原因 ( 自 变量 ) ping 

Cl C: C; Cy Cs ‘ x ‘ Gh E 

1 0 1 1 1 1 1 

2 1 0 1 0 1 1 

3 1 0 0 1 1 1 

4 1 1 0 0 1 1 

5 1 1 0 1 1 


的 任意 一 次 中 都 未 出 现 的 原因 Ci 不 应 被 认为 是 社会 革命 的 原因 。 我 们 会 
猜测 ,或 许 贫 穷 (C4 ) 会 引发 社会 不 满 和 革命 倾向 。 然 而 ,如 果 研 究 者 发 现 
在 这 5 个 个 案 中 ,有 一 些 个 案 中 的 人 们 很 富裕 ,那么 这 个 因素 就 该 被 排除 。 
R C4 之 外 ,假设 研究 者 们 进一步 排除 了 Cl 、Cz 、Cs ,但 发 现 所 有 这 5 次 社 
会 革命 发 生前 ,都 有 战争 失利 的 情况 ,那么 根据 求 同 法 ,战争 结果 (Cs ) 就 是 
社会 革命 的 一 个 原因 。 

求 同 法 基于 不 变 前 件 和 不 变 后 件 之 间 的 因果 关系 。 正 如 拉 津 (Ragin， 
1987:37) 指 出 的 ,这 一 方法 是 寻找 “不 变 ” 的 模式 一 一 所 有 关键 事件 中 的 不 
变 因素 通过 另 一 个 (前 件 ) 在 所 有 事件 中 都 相同 的 条 件 来 解释 。 

求 同 法 经 常 与 差异 最 大 设计 (Przeworski & Teune，1970:34 一 39) 联 系 
在 一 起 。 在 差异 最 大 设计 中 ,研究 者 从 不 同 的 情境 下 抽取 个 案 , 且 各 个 事件 
的 大 量 条 件 都 有 差异 。 然 后 ,研究 者 寻找 个 案 共 同 点 来 识别 现象 的 原因 。 

在 斯 考 切 波 的 《国家 与 社会 革命 》(States and Social Revolutions ) 一 书 中 ， 
她 解释 了 3 个 发 生 革命 的 个 案 ,强调 并 无 太 多 共同 点 的 3 个 个 案 之 间 的 “关键 相 
似 性 ”CSkocpol，1984a:379 一 380) 。 研 究 者 控制 了 结果 (结果 即 发 生 革命 ), 然 
后 从 不 同 的 情境 下 选取 个 案 , 从 而 消除 大 量 个 案 之 间 并 无 共同 性 的 前 件 , 最 后 
把 共同 条 件 分 离 出 来 。 

戴 穆 尔 和 伯 格 - 施 洛 瑟 强调 了 ,这 种 设计 实际 上 就 是 “ 同 果 差 异 最 大 设计 ” 
(MD-SO) (De Meur & Berg-Schlosser，1994) 。 他 们 提出 一 个 基于 测量 个 案 间 
(比如 ,国家 ) 差 异 的 测度 一 一 “布尔 距离 ”(Boolean distance) 就 是 那些 能 区 
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分 个 案 的 二 分 变量 的 总 数目 。 如 果 两 国 在 许多 二 分 变量 上 不 同 ,那么 它们 就 比 
那些 在 所 有 变量 上 无 差异 的 情况 具有 更 大 的 布尔 距离 。 通 过 “相似 / 相 异 甜 
阵 ”, 他 们 选择 一 些 具 有 相似 结果 的 国家 ,并 且 识 别 出 能 解释 这 一 现象 的 一 些 关 
键 相似 性 。 

这 一 方法 的 局 限 性 何在 ? 首先 ,这 一 方法 遇 到 了 实际 操作 上 的 困难 , 因为 
它 要 求 样本 个 案 在 各 个 方面 都 不 同 ,而 只 在 一 方面 相同 。 其 次 , 当 我 们 发 现 两 
个 以 上 的 前 件 都 在 各 事件 中 保持 不 变 时 ,就 会 产生 男 一 个 问题 。 这 一 方法 无 
法 判定 到 底 哪 一 个 不 变 前 件 是 现象 真正 的 原因 。 最 后 ,这 一 方法 无 法 处 理 多 
重 因果 性 , 即 在 某 个 案 中 ,EE 是 由 C1 导致 的 ,而 在 男 一 些 个 案 中 , 却 是 由 C3 导 
致 的 。 


求 异 法 


如 果 现 象 发 生 在 一 个 事件 中 ,而 在 另 一 个 事件 中 没有 发 生 ,而 这 两 个 
事件 在 每 一 个 条 件 上 都 相似 ,而 只 有 一 个 条 件 不 同 , 且 这 个 不 同 的 条 件 只 
发 生 在 第 一 个 事件 中 。 这 一 条 件 就 区 分 了 这 两 个 事件 , 它 是 现象 的 结果 或 
原因 ,抑或 原因 之 不 可 或 缺 的 部 分 。(Mill, 1875:452) 


密 尔 把 求 同 法 当做 现象 间 因果 关联 较 弱 的 展示 ,并 认为 求 同 法 的 弱点 可 由 
求 异 法 来 克服 。 如 果 在 所 有 的 前 件 中 确实 有 一 个 不 同 , 那 这 就 是 原因 或 现象 的 
结果 本 身 。 如 果 C 导致 已 ,我 们 不 仅 希望 在 瓦 出现 的 地 方 发 现 C ,还 希望 如 果 C 
不 出 现 ,那么 下 也 不 出 现 。 这 一 方法 对 比 两 种 类 型 的 事件 :为 真 (1) 和 为 假 (0) 
的 结果 EE, 可 用 下 面 的 表格 表示 。 

迈克 尔 。 BEAR (Michael Moore) 的 电影 ( 科 伦 拜 校园 事件 》( Bowling for 
Columbine ) 提 供 了 一 个 很 好 的 例子 。 他 观察 到 ,美国 和 其 他 国家 (英国 .加拿大 、 
法 国 , 德 国 ) 的 差异 是 ,在 美国 ,有 大 量 死亡 是 由 枪械 造成 的 。 这 种 差异 不 能 由 
这 些 国 家 的 相似 条 件 来 解释 ,从 而 摩尔 排除 了 诸如 暴力 传统 、 多 民族 混 居 和 贫 


基于 布尔 代数 的 比较 法 导论 











A 需 解 释 现象 
vil 潜在 原因 ( 自 变量 ) ( 因 恋 量 ) 
(tS) 

Ci C: C3 C, G Ge E 
1 1 0 1 1 0 0 
2 1 0 1 1 0 0 
3 1 0 1 1 0 0 
4 1 0 1 1 0 0 
5 1 0 1 1 1 L 


穷 等 原因 。 另 一 个 被 排除 的 原因 是 枪支 自由 买卖 ,因为 在 加 拿 大 ,情况 也 是 如 
此 。 他 得 到 的 结论 是 ,最 有 解释 力 的 变量 是 更 高 水 平 的 不 安全 感 ,美国 社会 弥 
漫 着 这 种 不 安全 感 ,这 是 由 令 人 叹为观止 的 商业 信息 系统 和 缺乏 公共 福利 所 造 
成 的 。 | 

求 异 法 考虑 事件 尽 可 能 多 的 相似 性 。 由 于 相似 性 本 身 不 能 解释 差异 , 因 
此 ,所 有 事件 都 具有 的 因素 就 可 被 排除 出 原因 之 列 。 这 一 方法 常 与 实验 法 联系 
在 一 起 ,因为 它 模仿 了 “实验 条 件 ” 一 只 有 一 个 自 变量 变动 ,而 其 他 变量 都 保 
持 不 变 。 在 社会 科学 中 ,这 种 接近 实验 的 数据 非常 少见 。 一 国之 内 两 个 时 点 的 
纵 贯 数据 提供 了 这 种 情境 (Skocpol, 1979:37)。 另 一 个 方法 是 把 经 验 个 案 与 想 
象 的 或 反 事实 的 个 案 当 做 理想 类 型 进行 对 比 (Bailey, 1982; Bonnell, 1980; Ra- 
gin, 1987:39; Stinchcombe, 1978). 

求 异 法 常 与 差异 最 小 设计 方法 联系 在 一 起 (Przeworski & Teune, 1970; 
32 一 34)。 通 过 选择 那些 在 许多 属性 上 都 相同 的 个 案 ,研究 者 可 排除 这 些 属性 ， 
并 聚焦 于 少数 属性 , 即 那些 在 个 案 之 问 变动 的 属性 ,从 而 检验 它们 之 间 的 因果 
关系 。 这 种 研究 设计 在 “区 域 研究 ”中 很 常见 ,它们 常常 从 具有 大 量 共同 性 的 地 
理 区 域 中 选取 个 案 。 

在 此 , 戴 穆 尔 和 伯 格 - 施 洛 瑟 强调 说 ,这 一 设计 是 “ 异 果 差异 最 小 设计 ” 
(MS-DO) (De Meur & Berg-Schlosser, 1994) ,并 且 通 过 相似 / 相 异 矩阵 ,我 们 
可 识别 少数 /大 量变 量具 有 相似 取 值 的 个 案 。 测 量 成 对 个 案 之 间 的 “布尔 距 
离 ”, 使 我 们 可 从 不 同 结果 中 分 离 出 个 案 差异 ,而 这 些 差 异 或 可 解释 在 其 他 方面 
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都 相似 的 个 案 的 不 同 结果 。 例 如 ,芬兰 和 爱沙尼亚 是 两 个 最 接近 的 例子 ,它们 
两 个 的 “布尔 逻辑 距离 ”非常 小 ,这 两 个 国家 在 非常 多 的 变量 上 都 有 相似 取 值 
(61 条 属性 中 只 有 14 条 不 同 )。 尽 管 如 此 ,前 者 (芬兰 ) 的 民主 制 得 到 了 维系 ,而 
后 者 (爱沙尼亚 ) 的 民主 制 却 骨 省 了 。 相 似 / 相 异 表 人 允许 研究 者 研究 那些 存在 最 
显著 差异 的 地 区 。 在 芬兰 和 爱沙尼亚 的 例子 中 ,不 同 结果 可 能 由 不 同 的 政治 文 
化 造成 。 

戴 穆 尔 和 伯 格 - 施 洛 瑟 强调 说 ,既然 存在 大 量 可 解释 社会 世界 差异 的 潜在 变 
量 , 那 就 很 难 严格 贯彻 寻找 “决定 性 差异 ”就 求 异 法 而 言 ) 或 “决定 性 相似 性 ”就 
求 同 法 而 言 ) 的 想法 。 这 很 明显 , 想 要 寻找 单独 的 、 决 定性 的 相似 性 或 差异 性 来 
作为 既定 现象 的 单一 原因 可 以 说 是 无 效 的 。 社 会 科学 家 发 现 某 一 有 趣 现象 的 
单一 原因 ,而 社会 现实 却 比 此 复杂 得 多 。 事 实 上 ,并 无 太 多 比较 研究 关注 分 离 
出 某 现 象 的 原因 。 

首先 ,我 们 必须 用 实证 的 态度 ,通过 形成 关于 其 影响 的 特定 假设 ,来 理解 单 
一 因素 导致 结果 的 想法 。 其 次 , 相 比 检验 单一 因素 ,比较 法 检验 组 合 因素 的 影 
响 ( 两 个 以 上 变量 取 值 或 分 数 的 组 合 )。 例 如 ,Xi 出 现 与 Xz 不 出 现 确 实 解释 了 
一 个 特定 结果 。 再 次 ,为 增加 控制 ,应 同时 采用 两 种 方法 一 一 同 果 差异 最 大 和 
异 果 差 异 最 小 。 如 上 面 强调 的 , 求 同 法 自身 不 能 够 解释 多 重 因果 或 “同等 性 ”， 
每 一 相同 结果 都 可 能 有 多 个 原因 。 只 有 用 同 果 差 异 最 大 方法 弥补 异 果 差异 最 
小 方法 时 ,才能 发 现 多 重 因果 和 因果 复杂 性 。 将 两 种 方法 结合 ,使 得 我 们 可 以 
继续 讨论 社会 科学 中 最 主要 的 比较 方法 。 








求 同 求 异 并 用 法 (或 间接 法 ) 


求 同 求 异 并 用 法 是 两 种 方法 的 联合 , 密 尔 这 么 定义 该 方法 : 


如 果 两 个 及 以 上 的 事件 在 某 一 现象 发 生 , 只 有 一 个 共同 条 件 , 同 时 , 当 
这 一 条 件 不 成 立时 ,在 两 个 以 上 事件 中 都 没有 此 现象 发 生 , 那 么 ,该 条 件 本 
身 就 可 区 分 两 组 事件 。 这 个 条 件 就 是 该 现象 的 结果 或 原因 ,抑或 原因 之 不 
可 或 缺 的 部 分 。(Mill，1875:458) 


基于 布尔 代数 的 比较 法 导论 } 


如 前 所 述 , 求 同 法 的 限制 在 于 ,研究 者 可 能 会 发 现 两 个 以 上 的 前 件 条 件 均 
保持 不 变 的 情况 。 那 么 ,如 何 能 够 在 它们 之 间作 出 区 分 ,从 而 确定 哪个 是 原因 
呢 ? 求 同 法 并 不 能 提供 答案 。 唯 一 的 解决 方案 是 引入 “反例 ”, 即 那些 结果 未 发 
生 的 个 案 。 

这 一 方法 可 以 用 下 表 来 表示 : 











etc ais 需 解 释 现象 
事件 潜在 原因 ( 自 变量 ) ( 因 变 量 ) 
(个 案 ) 
Cı C C; Gi Cs ; 5 š Ga E 
1 1 1 1 1 1 ] 
2 1 0 1 0 1 1 
3 1 0 0 1 1 1 
4 | 1 0 0 1 l 
5 1 1 0 1 1 1 
6 1 0 1 0 0 0 
多 1 1 1 0 0 0 


以 前 面 所 举 的 例子 为 例 ,假设 所 有 5 个 国家 都 有 同样 的 阶级 结构 (C1), 但 
在 政治 体制 .国际 地 位 和 财富 水 平 上 有 差异 。 在 这 种 情况 下 , 求 同 法 会 消除 Cz、 
C3 和 C4, 但 问题 是 ,阶级 结构 (Ci) 和 战争 结果 (Cs ) 中 ,哪个 是 革命 的 原因 ? 如 
果 只 取 5 个 “正面 案例 ”, 即 结果 发 生 的 个 案 CE = 1), 那么 , 求 同 法 无 法 帮助 我 
们 进行 区 分 。 通 过 加 入 “反例 ”6 和 “反例 ”7(E = 0), 上 表 ( 案 例 6 与 案例 7) 表 
明 ,Cs 不 成 立时 ,E 就 不 成 立 ;Ci 成 立时 ,EE 依然 可 能 不 成 立 。 

这 种 方法 的 一 个 应 用 是 摩尔 的 《专制 与 民主 的 社会 起 源 》(Social Origins 
of Dictatorship and Democracy) ,在 书 中 ,作者 试图 解释 不 同体 制 是 如 何 发 展 
起 来 的 。 摩 尔 运 用 了 几 个 个 案 , 向 读者 展示 了 不 同 阶级 构成 的 影响 。 比 如 , 贵 
族 与 资产 阶级 的 联盟 导致 了 自由 民主 (英国 ) ,而 那些 君主 与 贵族 阶级 形成 联盟 
反对 资产 阶级 的 国家 ,其 结果 是 法 西 斯 主义 (日 本 )。 尽 管 在 摩尔 的 书 中 , 这 一 
方法 是 隐 含 的 ,但 它 仍然 是 这 种 比较 方法 的 最 佳 例子 。 

斯 考 切 波 的 《国家 与 社会 革命 ) 一 书 明确 使 用 了 求 同 求 异 并 用 法 。 她 通过 
求 同 法 ,利用 3 个 具有 相同 结果 但 其 他 方面 相当 不 同 的 个 案 , 来 寻找 共同 解释 因 
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素 。 接 着 ,她 引入 了 求 异 法 ,通过 引入 反例 来 寻找 解释 因素 。 这 种 求 同 求 异 并 
用 法 的 使 用 ,使 她 辨别 出 关键 变量 “国家 裔 溃 ”。 当 革命 发 生 时 , 这 一 因素 总 是 
系统 性 地 出 现 ,而 革命 不 发 生 时 则 不 出 现 。 在 所 有 出 现 革 命 的 个 案 中 , 国家 力 
量 都 在 先前 的 大 战 中 被 削弱 了 一 一 制度 变 松散 了 ,国家 应 对 骚乱 的 能 力 变 
差 了 。 

求 同 求 异 并 用 法 经 常 被 称 为 “间接 差异 法 ”。 之 所 以 有 这 个 名 称 ,是 因为 求 
异 法 只 在 实验 室 条 件 下 才 有 可 能 实行 ,在 那里 ,变量 的 取 值 或 分 数 可 以 被 直接 
操控 。 相 反 ,在 社会 科学 中 ,变量 取 值 或 分 数 的 变异 只 能 通过 考察 正面 和 反面 
案例 一 一 结果 或 出 现 或 不 出 现 的 个 案 ( 因 此 是 间接 的 差异 ) 一 一 来 得 到 。 


共 变 法 


通过 共 变 法 ,我 们 离开 “性 质 ”( 属 性 成 立 与 否 ) 领 域 ,而 进入 到 “数量 ”( 属 性 
变异 强度 或 大 小 ) 领 域 。 与 依赖 二 分 变量 不 同 ,这 种 方法 基于 程度 和 连续 变量 。 
密 尔 这 样 定义 共 变法 : 


现象 p 发 生变 化 , 另 一 现象 q 随 之 变化 。 那 么 ,这 两 个 现象 的 这 种 相 
互 作用 就 表明 ,p 是 gq 的 原因 ,或 g 是 p 的 原因 ,或 两 者 都 是 同一 个 原因 的 
结果 。(Mill，1875:464) 


拉 津 和 扎 雷 特 把 共 变 法 与 密 尔 的 前 三 种 方法 对 立 起 来 ,把 共 变 法 称 为 " 涂 
尔 干 ” 式 定量 统计 策略 ,而 把 密 尔 前 三 法 称 为 “韦伯 式 ” 比 较 定性 策略 (Ragin & 
Zaret，1983)。 然 而 ,除了 很 难 把 所 有 “比较 学 者 ”都 归 入 韦伯 阵营 外 (Skocpol， 
1984a:360) , 求 同 法 和 求 异 法 也 可 基于 一 个 自 变 量 属性 的 出 现 与 否 与 男 一 个 因 
变量 属性 的 出 现 与 否 之 间 的 关联 性 。 正 因 如 此 ,和 其 他 方法 一 样 , 共 变 法 最 终 
仍 基于 求 异 法 , 即 考察 的 是 0 和 1 之 间 的 关联 性 。 两 类 方法 的 区 别 只 在 于 ,数据 
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本 质 上 是 离散 的 还 是 连续 的 。 
对 密 尔 法 的 批评 


对 这 些 方法 有 两 类 主要 的 批评 ,两 者 都 直接 指向 密 尔 及 他 之 前 的 培根 宣称 
的 这 些 方法 的 重要 性 , 即 密 尔 法 是 发 现 现象 的 原因 与 结果 的 工具 ,并 且 是 展现 
原因 一 结果 关联 性 的 逻辑 工具 。 这 些 “ 宣 称 ” 说 明 , 这 些 方法 会 指导 科学 研究 发 
明 一 种 能 够 机 械 地 、 系 统 地 发 现 和 证 明 因果 关联 的 方法 (Cohen & Nagel, 1934; 
245—267; Copi，1978:352 一 364) 。 

先 来 看 发 现 的 方法 。 首 先 , 密 尔 法 要 求 所 有 的 前 件 都 被 纳入 分 析 , 以 识别 
原因 。 然 而 ,纳入 所 有 的 条 件 ( 例 如 ,在 求 异 法 中 ,两 个 事件 必须 在 除 一 个 以 外 
其 余 所 有 条 件 上 取 值 都 相同 ) 会 使 得 工作 相当 繁琐 , 因为 条 件数 目 是 无 限 的 。 
正 因 如 此 ,要 求 纳入 所 有 前 件 必 须 被 理解 为 只 纳入 那些 相关 的 因素 。 

决定 哪些 是 相关 前 件 并 非 方法 的 问题 ,而 是 一 种 额外 的 知识 。 在 应 用 密 尔 
法 之 前 ,研究 者 必须 决定 把 哪些 前 件 纳入 “模型 ”>。 但 是 ,这 些 方法 不 能 消除 遗 
漏 相 关 因 素 的 风险 。 因 此 ,它们 并 不 能 发 现 未 知 或 意外 事件 原因 的 方法 ,最 多 
能 帮助 研究 者 在 那些 可 能 具有 潜在 相关 性 的 因素 中 ,识别 出 最 有 可 能 的 原因 。 
这 就 是 说 ,发 现 还 须 理论 指导 。 

其 次 , 密 尔 法 不 能 提供 对 前 件 分 析 的 指导 。 这 事 关 研究 者 如 何 处 理 潜 在 的 
解释 变量 。 减 少 变量 数量 可 使 研究 者 聚拢 解释 因素 ,并 发 现 给 定 的 政治 文化 增 
加 了 “社会 凝聚 力 ”。 同 时 ,我 们 可 能 会 同时 单独 考虑 政治 文化 几 个 不 同方 面 
(fa EAC .认同 类 型 ,传统 性 和 现代 性 之 间 的 平衡 ,等 等 ) ,并 发 现 只 有 部 分 因 
素 影响 了 政治 不 稳定 性 。 再 次 ,前 件 的 分 析 可 依靠 应 用 密 尔 法 之 前 的 额外 知识 
而 展开 。 

再 来 看 证 明 的 方法 。 考 虑 到 这 些 方法 是 展示 性 的 ,于 是 便 产 生 两 类 批评 。 
首先 ,根据 第 一 点 ,如 果 和 忽略 了 相关 变量 , 且 / 或 前 件 分析 不 正确 的 ,那么 ,因果 
关联 的 结论 或 许 就 是 错误 的 。 既 然 考虑 每 一 个 可 能 前 件 是 不 可 能 的 一 一 或 许 
与 错误 分 析 混 在 一 起 一 一 那么 就 不 能 证 明 某 原因 是 真正 原因 。 关 系 可 能 是 虚 
假 的 ,有 条 件 的 或 间接 的 (Ragin，1987:37; Zelditch，1971:300 一 305) 。 其 次 ， 
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更 一 般 而 言 , 归 纳 推理 从 来 不 是 逻辑 上 证 实 论 的 ,因为 它们 基于 部 分 而 非 所 有 
事件 的 经 验 观 察 。 只 要 还 有 未 被 观察 的 个 案 ,这 一 因果 关联 就 存在 被 推翻 的 可 
能 性 。 

这 一 批评 不 仅 适 用 于 密 尔 前 三 法 ,而 且 同 样 适 用 于 共 变 法 和 统计 学 。 甚 至 
在 那些 依赖 大 量 观测 个 案 的 研究 设计 当中 ,对 未 观测 个 案 属 性 的 推断 也 从 来 不 
是 确定 的 ,最 多 是 很 有 可 能 。 一 般 而 言 , 有 效 演绎 陈述 构成 了 证 明 , 而 因果 关系 
的 归纳 陈述 总 是 或 然 性 的 。 

因果 关系 的 “发 现 和 证 明 ” 要 求 在 应 用 这 些 方法 之 前 ,对 前 件 作 出 一 些 预 
设 。 用 密 尔 自己 的 术语 来 讲 , 密 尔 法 既 非 发 现 , 亦 非 证 明 的 充分 工具 。 


假设 与 演绎 有 效 性 


那么 ,既然 这 些 方 法 “ 既 非 证 明 方法 ,又 非 发 现 的 方法 ”(Cohen & Nagel, 
1934:266) ,那么 它们 又 有 何 价值 呢 ? 上 述 看 法 是 从 严格 意义 上 考虑 的 ,但 密 尔 
自己 只 谨慎 地 希望 把 这 一 方法 作为 系统 性 科学 探索 的 一 个 指引 。 所 以 ,尽管 既 
非 发 现 又 非 证 明 的 方法 ,但 它们 依然 是 不 可 或 缺 的 分 析 工 具 。 

首先 ,既然 不 可 能 把 所 有 的 前 件 都 纳入 进来 ,那么 这 些 方法 就 要 求 事先 形 
成 一 些 假设 , 即 研究 者 需要 对 纳入 那些 与 解释 现象 相关 的 条 件 进行 说 明 。 因 
此 ,这 些 方法 必须 与 某 些 假设 一 起 使 用 。 

其 次 ,这 些 方法 是 排除 虚假 因果 关系 的 规则 。 它 们 被 认为 本 质 上 是 排除 性 
的 ,而 非 列 举 性 的 归纳 方法 。 一 个 假设 并 不 会 因为 事件 支持 它 而 被 确认 ,只 是 
由 于 目前 它 仍 未 被 排除 。 一 般 性 陈述 根本 不 能 被 证 实 , 它 们 只 能 被 证 伪 (Pop- 
per，1959、1989)。 排 除 一 些 假设 可 以 帮助 确认 那些 能 经 受 证 伪 检 验 的 假设 。 
排除 性 归纳 提供 了 一 个 更 强 的 归纳 。 支 持 一 个 假设 的 证 据 只 可 能 是 部 分 的 (从 
来 不 会 是 绝对 的 ) ,而 拒绝 或 者 排除 它 是 绝对 的 (一 次 足够 )。 因 此 ,形成 假设 时 
需 注意 它 必须 是 可 证 伪 的 , 即 设 定 哪些 情况 可 证 伪 假 设 。 

如 果 我 们 定义 了 一 组 关于 原因 的 备 择 假设 (C1、C2、Cs 或 Cs 作为 假设 性 
解释 因素 ) ,同时 排除 了 C1、Cz 和 C4 作为 EE 的 原因 ,但 未 排除 Cs ,那么 Cs 被 确 
UAE ERA, AMRF Cs 和 巨 的 因果 关联 的 假设 通过 经 验 检验 未 被 拒绝 


基于 布尔 代数 的 比较 法 导论 


(而 C1、Cz 和 C4 已 被 拒绝 ), 且 这 一 推论 是 基于 有 效 的 演绎 论 的 
下 面 的 三 段 论 可 证 明 这 一 点 (这 一 例子 应 用 了 求 同 法 ): 


如 果 Ci 是 EE 的 原因 ,那么 不 可 能 在 Ci 不 成 立时 出 现 
有 一 个 (或 更 多 ) 个 案 显示 , 尼 发 生 , 而 Cl 却 不 发 生 
“C1 并 非 上 的 原因 
这 一 结论 是 有 效 的 演绎 法 ,因为 这 一 论断 在 三 段 论 的 第 一 行 包含 了 一 个 假 
设 ,或 更 精确 地 说 ,一 个 “假设 前 提 ”。 接 着 ,科恩 和 内 格 尔 根据 排除 性 的 认识 论 
的 假设 检验 法 ,提出 一 个 “否定 表达 式 ” 的 求 同 法 和 求 异 法 的 公式 (Cohen & Na- 
gel，1934)。 根 据 这 一 个 公式 : 





当 一 个 条 件 并 非 所 有 为 真 现象 的 共有 条 件 时 ,这 一 条 件 不 可 能 是 现象 
的 原因 。(Cohen & Nagel，1934:255) 当 假设 的 原因 (条 件 ) 出 现时 ,现象 并 
未 出 现 ,那么 ,这 个 条 件 不 可 能 是 现象 的 原因 。[19](Cohen & Nagel, 1934; 
259) 


必须 有 一 个 假设 H REHAR 1» H2, H3, ++), ARWAH 
了 那些 非 真 的 假设 。 在 下 文 ,我 们 将 再 次 介绍 必要 与 充分 条 件 的 区 别 , 并 介绍 
那些 建立 因果 关联 的 策略 。 下 面 的 介绍 将 遵循 以 下 两 大 策略 :基于 结果 和 基于 
原因 。 就 前 者 而 言 ,研究 者 努力 去 发 现 现象 的 原因 (大 部 分 发 生 在 社会 科学 
中 ); 就 后 者 而 言 ,研究 者 试图 发 现 现象 的 效果 (在 实验 室 研究 中 很 典型 )。 这 两 
种 研究 策略 的 区 别 在 于 ,是 选择 正面 案例 还 是 反面 案例 。 
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本 章 分 为 3 个 主要 部 分 。 首 先是 介绍 检验 单个 因素 作为 充分 和 /或 必要 条 
件 的 5 种 方法 ,它们 都 基于 求 同 法 、 求 异 法 和 求 同 求 异 并 用 法 (间接 差异 法 )。 其 
次 是 介绍 联合 方法 , 它 基 于 建构 自 变量 取 值 而 进行 解释 。 这 两 个 部 分 处 理 的 都 
是 二 分 数据 , 即 变 量 值 或 出 现 (1) 或 不 出 现 (0)。 最 后 一 部 分 处 理 的 是 非 二 分 数 
据 , 即 模糊 集合 分 析 。 


寻找 充分 条 件 


根据 结果 (方法 1) 


如 前 面 所 说 的 ,就 充分 的 “原因 ?而 言 ,充分 条 件 比 必要 条 件 更 易 理 解 。 所 
以 ,我 们 从 充分 条 件 开 始 。 如 果 C( 一 个 假设 的 原因 ) 是 E( 一 个 假设 的 结果 ) 的 
充分 条 件 ,那么 ,C 蕴含 了 玉 , 条 件 真 值 表 如 下 : 





Ç 一 > E 
I T 1 1 
I 1 0 0 
ll 0 1 1 
IV 0 1 0 


WR CEE BEDR BARAASA CHAME 却 不 出 现 的 个 案 。 这 就 
是 说 , C= 二 1 且 E==0 的 组 合 (组 合 [[) 是 不 可 能 的 ,或 用 贝 叶 斯 概率 符合 表示 就 
是 P(C |~ E) = 0, 注意, 组合 了 拒绝 这 一 假设 。 例 如 ,比例 选举 制 系统 是 多 党 
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制 的 充分 条 件 ,那么 就 不 可 能 有 比例 选举 制 和 两 党 制 并 存 的 系统 。 


WR CHE 的 充分 条 件 , 则 下 不 成 立时 ,C 也 不 可 能 出 现 
有 一 个 (或 更 多 ) 个 案 显示 ,E 示 出现, 而 C 却 发 生 了 
“…C HAEE 的 充分 原因 





在 实践 中 运用 这 一 研究 策略 ,一些 = 0 的 个 案 被 选取 出 来 。 潜 在 的 充分 
FIEC, Cz, C3,，…) 被 检验 且 很 可 能 被 排除 。 根 据 组 合 卫 的 真 值 表 , 可 以 排 
除 C = 1, EE= 0 这 一 组 合 。 


事件 潜在 的 充分 条 件 ( 自 变量 ) ica 
(个 案 ) 
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根据 此 表 , 除 了 Cz ,我 们 可 以 排除 所 有 潜在 条 件 , 它 们 都 不 是 充分 原因 。 这 
就 是 说 ,我 们 不 能 排除 那些 C= 0, E= 0 的 个 案 (组合 IV ) 。 


根据 原因 (方法 2) 


MARCHE 的 充分 条 件 , 那 么 ,每 当 C 出 现时 ,E 必然 出 现 。 如 果 玉 不 出 
现 ,那么 C 就 不 是 下 的 充分 条 件 。 其 次 ,C AR T ECE) ,其 条 件 真 值 表 与 上 
文 方法 1 的 相同 。 

作为 根据 结果 的 方法 ,如 果 C E E 的 充分 条 件 , 那 么 ,就 不 应 有 任何 一 个 C 
HME 不 出 现 的 个 案 。 也 就 是 说 ,没有 C= 二 1 且 ==0 (组合 上) 的 组 合 ,或 者 
用 贝 叶 斯 概念 符号 表示 , 即 PCC |~ E) = 0。 再 次 提醒 ,是 组 合 卫 拒绝 了 假设 。 

演绎 推论 形式 是 一 样 的 : 
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WR CHE 的 充分 条 件 ,那么 下 不 成 立时 ,C 也 不 可 能 出 现 

有 一 个 (或 更 多 ) 个 案 显 示 ,E 未 出 现 ,而 C 却 发 生 了 

“CIHR E 的 充分 原因 

在 实践 中 ,研究 策略 是 不 同 的 。 与 选择 已 = 0 那些 个 案 ( 即 结果 未 发 生 的 反 

例 ) 不 同 ,我 们 根据 C = 1 选择 个 案 , 即 在 所 有 的 个 案 中 ,我 们 假设 为 充分 条 件 的 
条 件 总 是 出 现 。 根 据 这 一 方法 ,所 有 被 选择 的 个 案 都 是 C = 1 的 。 然 后 ,结果 
(Ei, E2, ，E3 ，…) 被 检验 且 我 们 很 有 可 能 排除 备 择 假设 。 根 据 真 值 表 组 合 工 ， 
我 们 排除 组 合 C = 1, E=0. 





潜在 充分 
结果 ( 因 变 量 ) 
事件 ”条件 ( 自 变量 ) 等 果 ( 央 变量 
ae a 
Ci E: E: E; E; . . . En 
1 1 0 1 1 0 
2 1 0 1 1 0 
3 1 0 l 1 0 
4 1 0 0 1 1 
5 1 0 0 l 0 


这 是 一 种 更 加 “实验 ”和 实践 取向 的 方法 ,因为 它 控制 了 原因 ,并 试图 识别 
其 结果 。 根 据 上 表 , 我 们 排除 C 是 El1、Ez 和 Es 的 充分 条 件 的 可 能 性 。 但 我 们 
不 能 排除 C 作为 Es 的 充分 条 件 的 可 能 性 。 也 就 是 说 ,不 能 根据 C= 1, E=1 
(组 合 工 ) 而 拒绝 充分 条 件 。 


寻找 必要 条 件 


根据 结果 (方法 3) 


根据 这 一 方法 ,给 定 事件 三 ,我 们 想 知 道 ,在 一 系列 潜在 的 必要 条 件 中 ,哪些 
因素 会 被 拒绝 ,而 哪些 不 会 。 
正如 上 面 所 讲 的 ,如 果 C( 一 个 假设 的 原因 ) 是 EE( 一 个 假设 的 结果 ) 的 必要 
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ANF ABZ CRE Mai (CE). A AAU FE : 





E > C 
I 1 1 | 
I 1 0 0 
ll 0 1 1 
TV 0 1 0 


此 时 ,是 E>C, 而 非 C>E( 如 充分 条 件 那 样 )。 

如 果 C 是 下 的 必要 条 件 ,那么 就 不 会 有 玉 存 在 而 C 不 出 现 的 个 案 。 也 就 是 说 ， 
MEAS C= 0 且 玉 二 1 (组 合 四 ,用 贝 叶 斯 概率 符号 表示 就 是 P(~~C | E) = 0。 
又 是 组 合 [拒绝 了 假设 。 如 果 公 民政 治文 化 是 民主 制 的 稳定 性 的 必要 条 件 ,那么 ,就 
不 会 出 现任 何 个 案 的 民主 制 是 稳定 的 而 公民 政治 文化 却 缺 失 的 情况 。 

根据 演绎 法 : 


WR CHE 的 必要 条 件 , 那 么 玉成 立时 ,C 不 可 能 不 出 现 
有 一 个 (或 更 多 ) 个 案 显示 ,发 生 了 ,而 C 却 未 出 现 
"C 并 非 的 必要 条 件 
在 实践 中 ,通过 这 一 研究 策略 ,我 们 选择 那些 == 1 的 个 案 。 然 后 检验 潜在 
的 必要 条 件 (CI，Cz ，Cs，…) 并 排除 它们 。 根 据 真 值 表 组 合 工 ,排除 那些 
C=0, E=1 Øg. 














结果 
y /以 ARB “A 
hed 潜在 的 必要 条 件 ( 自 变量 ) ( 因 变量 ) 

j 

Cı C: C3 Cy C: Ga E 

1 1 0 1 1 0 1 

2 0 0 1 1 0 1 

3 0 0 1 1 0 1 

4 1 0 0 1 0 1 

5 1 0 0 1 1 1 


根据 此 表 , 我 们 可 以 排除 Ca 之 外 的 潜在 条 件 (作为 已 必要 条 件 的 可 能 性 ) 。 
也 就 是 说 ,我 们 不 能 拒绝 C= 1, EE = 1 的 组 合 工 。 
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如 布 劳 莫 勒 和 戈 茨 (Braumoeller & Goertz，2000: 846) 指 出 的 , 当 检 验 得 
出 C 是 E 的 必要 条 件 时 ,如 果 C 在 E HUN tH ABA ARLE E = 0 的 个 案 
是 无 关 的 。 这 可 用 下 表 来 表示 : 





FT 





1 0 1 | 











fee 4 E H.C 总 出 现 , 即 PCC | E) = 1. 我们 只 选择 那些 E= 1 
的 个 案 。 


根据 原因 (方法 4) 


如 果 C 是 EE 的 必要 条 件 ,那么 当 C 不 出 现时 , 巨 也 不 会 出 现 ; 如 果 巨 出 现 ， 
Il CIEE 的 必要 条 件 。 并且,C 被 E 所 蕴 合 (C<E)。 条 件 真 值 表 与 方法 3 
一 样 0。 
正如 基于 结果 的 方法 一 样 ,如 果 CE E 的 必要 条 件 , 那 就 不 存在 巨 出现 而 
C 不 出 现 的 个 案 。 也 就 是 说 ,不 存在 C= 0 A E= 1 组 合 (组 合 IL) ,或 用 贝 叶 斯 
概念 符号 表示 为 P(~C | E) = 0。 组 合 开 用 于 拒绝 假设 。 
演绎 法 表示 方法 相同 ， 
WE CEE 的 必要 条 件 ,那么 EE 成 立时 ,C 不 可 能 不 出 现 
有 一 个 (或 更 多 ) 个 案 显 示 , 玉 发 生 了 ,而 C 却 未 出 现 
“CHAE E 的 必要 条 件 
在 实践 中 ,研究 者 的 策略 却 不 同 。 与 根据 正 =- 1 而 选择 个 案 不 同 (根据 事件 
发 生 ) ,我 们 根据 C — 0 进行 选择 , 即 那些 假定 必要 条 件 不 出 现 的 个 案 。 通 过 这 
一 研究 策略 ,我 们 选择 的 都 是 C 二 0 的 个 案 。 检 验 结果 (E1，E2，E;，…) ,然后 








© 原文 是 “Again, C implies E, C—>E, and the conditional truth table is the same as above in 
Method 3 on effects”。 这 明显 是 错误 的 ,C>E 是 充分 条 件 的 表述 ,而 必要 条 件 应 当 是 CAE, A le] A 
要 条 件 表述 的 、 基 于 结果 的 方法 3 明确 使 用 了 C<-E。 因 此 ,根据 文 意 改 正 。 一 一 译 者 注 
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排除 部 分 个 案 。 根 据 真 值 表 组 合 工 ,我们 排除 那些 C = 0 HE = 1 的 个 案 。 


潜在 必要 











gk Jib 
事件 条 件 ( 自 变量 ) 结果 ( 因 变量 ) 
TÆ) 
Ci E: E: E; E, . ; . E, 
3 0 0 1 p ð 
4 0 0 0 0 1 
5 0 0 0 0 1 


男 外 ,作为 基于 原因 的 方法 ,这 是 一 个 更 “实验 性 ”的 方法 。 根 据 此 表 , 我 们 
可 以 排除 C 作 为 E1、Ez Al Es 的 必要 条 件 , 但 不 能 排除 C 作为 Es 的 必要 条 件 ， 
因为 我 们 不 能 根据 C= 二 0 且 E=0( 组 合作) 而 拒绝 条 件 C AE 的 必要 条 件 。 在 
C 不 出 现时 看 是 否 出 现 ,从 而 检验 C 是 不 是 五 的 必要 条 件 , 在 此 情况 下 ， 
C =1 的 个 案 是 无 关 的 。 











C 

0 1 
ele i 
E 
TEDE 











4% E RHM, CAERE, E PC C|~ E) = 1, 因此 ,只 选取 C= 
0 的 个 案 。 

总 而 言 之 ,所 有 4 种 方法 都 是 根据 组 合 I (C= 0, E= 1) 来 拒绝 HR 
设 ) 。 在 检验 充分 条 件 时 ,基于 结果 的 方法 1, 不 能 根据 组 合 W (C= 0, E= 0) 
来 拒绝 假设 ;基于 原因 的 方法 2, 不 能 根据 组 合 I (C= 1, E= 1) 来 拒绝 假设 。 
而 在 检验 必要 条 件 时 ,基于 结果 的 方法 3 ,不 能 根据 组 合 I (C= 1, E= 1) KE 
绝 假设 ;基于 原因 的 方法 4, 则 不 能 根据 组 合 W (C = 0, E = 0) 来 拒绝 假设 了。 








© 此 处 原文 是 ”With the methods based on causes we do not reject H based on combination NV 
(0, 0) and with the methods based on effects, we do not reject H based on combination Į (1, 1)”, [a 
题 在 于 ,这 里 总 结 的 是 4 种 方法 。 同 为 基于 结果 的 方法 ,充分 条 件 方法 1 和 必要 条 件 方法 3 所 不 能 拒 
绝 假设 的 组 合 是 不 同 的 。 同 为 基于 原因 的 方法 ,方法 2 和 方法 4 不 能 拒绝 的 组 合 亦 不 同 。 因 此 ,根据 
文 意 改正 。 一 一 译 者 注 
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这 些 方 法 可 与 不 同 的 研究 策略 一 起 拒绝 虚假 假设 。 如 果 要 检验 比例 选举 
制 (PR) 是 多 党 制 (MPS) 的 充分 条 件 , 那 么 我 们 可 以 基于 原因 ,选择 那些 PR = 1 
的 个 案 , 看 是 否 所 有 MPS= 1, 然后 基于 结果 ,选择 那些 MPS = 0( 即 两 党 制 ) 的 
国家 ,看 是 否 存在 个 案 PR = 1。 相反, 如果 想 看 比例 选举 制 是 不 是 多 党 制 的 必要 
ANE ,那么 我 们 可 以 基于 原因 ,选择 那些 多 数 票 制 的 国家 (PR = 0), 看 是 否 存 在 
MPS = 1 的 个 案 ,然后 基于 结果 ,我 们 选择 那些 MPS = 1 的 国家 ,看 是 否 存在 
PR = 0 的 个 案 。 

简 言 之 ,控制 假设 可 通过 下 述 方式 进行 :选择 原因 ,观察 其 结果 或 选择 结 
果 , 追 溯 其 原因 。 

研究 策略 的 选择 经 常 基于 有 了 哪些 有 多少 个 案 可 用 。 在 实践 中 ,使 用 不 同 
方法 的 组 合 能 增强 解释 力 。 


“Fa on” 


MARMAR MA ER. AAT BH 2 ERR: “FEE Ee 
心 引 力 成 为 战争 的 琐 细 必要 条 件 ?”(Goertz & Starr，2003) 。 有 两 种 主要 的 琐 
细 形 式 和 一 种 非 琐 细 个 案 。 

Hi 1. WR E HSU. C 总 是 出 现 ,那么 C 是 王 的 必要 条 件 。 如 果 选 
FIE E = 1 的 个 案 ,那么 总 有 C = 1 (方法 3)。 然 而 ,C 有 可 能 在 已 = 0 时 同样 
出 现 。 地 心 引 力 是 不 是 战争 的 必要 条 件 呢 ? 是 的 。 因 为 发 生 战 争 时 (五 = 1 ), 地 
心 引力 总 是 存在 (C= 1 )。 在 这 一 个 案 中 , 自 变 量 (C) 不 存在 变异 。 地 心 引 力 对 
战争 发 生 和 不 发 生 而 言 ,都 是 一 个 琐 细 的 必要 条 件 。 


P(C|~E)=1H P(C|E)=1 


琐 细 类 型 2: 当 CAHN Eth AL ABA CAE 的 必要 条 件 。 如 果 
选择 C = 0 ABLE TS ABABA E = 0 (方法 4)。 然 而 ,E 可 能 在 C 出 现时 同样 
不 出 现 。 那 么 ,至 少 一 方 是 威权 国家 是 不 是 战争 发 生 的 必要 条 件 ? 是 的 。 因 为 
没有 威权 国家 时 ( C = 0), RACERACE = 0 )。 然 而 ,即使 存在 威权 国家 ,也 
可 能 不 发 生 战 争 。 在 此 例 中 , 因 变 量 (E) 没 有 变异 。 因 此 ,威权 国家 同时 是 发 生 
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战争 和 不 发 生 战争 的 琐 细 必要 条 件 ; 
P(~C|~E) =1H P(C|~E)=1 


非 琐 细 :为 了 避免 类 型 1 和 类 型 2 的 琐 细 性 问题 , 自 变 量 和 因 变 量 (C 和 EE) 
都 必须 具有 一 定 的 变异 。 为 了 避免 融 细 类 型 1, 我 们 需要 在 自 变 量 (C) 上 有 所 变 
异 ; 为 了 避免 珊 细 类 型 2 ,我 们 需要 在 因 变 量 (E) 上 有 所 变异 。 在 实践 中 ,这 意味 
着 我 们 需要 同时 使 用 方法 3 和 方法 4 来 满足 非 琐 细 必要 条 件 。 如 果 PR( 比 例 选 
举 制 ) 是 MPS( 多 党 制 ) 的 必要 条 件 , 那 么 在 MPS 出 现时 ,PR 也 总 是 出 现 , 即 
P(C | E) = 1。 然 而 ,为 了 避免 融 细 性 (类 型 1) , 当 MPS 不 出 现时 ,PR 也 必须 不 
出 现 , 即 PCC ~E) ==0。 另 外 ,如 果 PR Æ MPS 的 必要 条 件 ,那么 在 PR 不 出 现 
Hf, MPS 也 不 出 现 , 即 PC C ||~ E) = 1。 然 而 ,为 了 避免 珊 细 性 (类 型 2) ,在 
MPS 不 出 现时 ,PR 也 不 能 出 现 , 即 PC ~E) = 0 。 因 此 ,我 们 总 结 如 下 : 


P(C| E) =1 8 P(~C|~E) = 1 


琐 细 类 型 1 琐 细 类 型 2 非 琐 细 

















充分 必要 条 件 (方法 5) 


上 面 讨论 的 4 种 方法 为 更 复杂 的 分 析 提 供 了 基础 。 首 先 ,它们 允许 我 们 识 
别 那些 既 充 分 又 必要 的 条 件 。 其 次 ,它们 提供 了 进行 多 变量 分 析 和 联合 分 析 法 
的 工具 。 

为 了 识别 那些 充分 必要 条 件 ,我 们 必须 使 用 两 种 真 值 表 。 将 充分 条 件 和 必 
要 条 件 的 真 值 表 组 合 起 来 ,使 我 们 能 识别 出 充分 必要 条 件 。 然 而 ,与 只 依赖 组 
合 式 来 拒绝 假设 不 同 , 这 一 组 合 依据 组 合 开 与 组 合 亚 来 拒绝 假设 。 

真 值 表 如 下 : 
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C < E 
I 1 1 1 
I 1 0 0 
M 0 0 1 
WV 0 1 0 





在 这 里 ,>( 或 三 ) 代 表 “ 等 价 于 ”或 “ 互 为 蕴含 "。 在 简单 的 充分 或 必要 条 件 
的 真 值 表 中 ,只 有 组 合 开 的 中 间 栏 是 0, 而 在 充分 必要 条 件 的 真 值 表 中 ,组 合 工 
与 组 合 亚 中 间 一 栏 都 为 0。 

在 实践 中 ,我 们 先后 使 用 这 两 张 真 值 表 。 首 先 ,排除 那些 非 充分 条 件 。 其 
次 ,在 第 一 阶段 检验 中 “存活 ?下 来 的 条 件 里 面 排除 非 必 要 条 件 , 剩 下 的 条 件 就 
都 是 充分 必要 条 件 了 。 








事件 潜在 的 充分 必要 条 件 ( 自 变量 ) os 
(个 案 ) 
1 C: Cs Ga C: om E 
1 1 1 1 l 1 1 
2 1 0 1 0 1 1 
3 1 0 0 1 1 1 
4 1 1 0 0 1 1 
5 1 0 1 1 1 
6 1 0 1 0 0 0 
7 1 1 1 0 0 0 


WR CHE 的 充分 条 件 , 则 当 C 出 现时 ,EE 也 总 是 出 现 , 即 PCC | E) = 1; 
而 当 C HOR. E AREA HBL, BI PCC |~ E) 一 0。 若 非 如 此 , 则 可 以 根据 组 合 工 
而 拒绝 五 。 在 上 表 中 ,可 以 拒绝 Ci, C, CG EH E WAAR. BLUE , on 
R CEE 的 必要 条 件 , 则 当 玉 出 现时 ,C 也 总 是 出 现 , 即 PCC | E) = 1; 同时 , 当 
E 出 现时 ,C 不 能 不 出 现 , 即 P(~C| E) =0。 若 非 如 此 , 则 可 以 根据 组 合 焉 而 拒 
绝 互 。 这 就 排除 了 C4 作为 五 的 必要 条 件 。 这 一 方法 实际 上 基于 求 同 求 异 并 用 
法 (或 称 " 间 接 法 ”) 。 


基于 布尔 代数 的 比较 法 导论 


用 有 多 辑 代数 进行 多 变量 分 析 


前 面 的 方法 受到 批评 是 由 于 它 过 于 复杂 ,尤其 是 应 用 于 多 变量 分 析 时 。 

ee 
Tarski, 1963; Roth, 2004; von Wright，1951) 。 这 一 节 将 首先 展示 逻辑 代数 
的 基本 符号 及 它们 在 多 变量 研究 设计 中 的 用 处 。 LKR 绍 布尔 分 析 法 。 最 
近 , 有 些 很 有 影响 的 文献 强调 在 多 变量 分 析 中 设置 代数 方法 的 可 能 性 (Ragin， 
1987: 85 一 163) 。 当 代 比 较 研 究 设 计 最 主要 的 优势 在 于 , 它 可 以 容纳 解释 变量 
的 建构 或 组 合 。 


复合 陈述 


多 变量 分 析 研究 者 寻找 的 是 充分 和 /或 必要 条 件 的 组 合 属性 , 而 非 单 个 属 
性 。 拉 津 把 这 种 “组合 逻辑 作为 比较 法 最 突出 的 特点 (Ragin，1987: 5)。 与 依 
照 递 增 性 逻辑 逐个 检验 潜在 充分 或 必要 条 件 假设 的 经 验 有 效 性 不 同 ,这 种 方法 
检验 变量 按 特定 方式 组 合 时 的 有 效 性 。 为 解释 如 何 实现 这 一 点 ,在 此 需 介 绍 一 
些 基 本 的 逻辑 代数 。 

多 变量 分 析 基 于 联合 陈述 中 的 3 个 基本 布尔 符号 或 连接 词 : 且 \ 或 . 非 。 

联合 符 ( 且 ) 用 符号 表示 是 *。 "BRA A” We 
(1) 的 联合 陈述 (Cl H Cz)。 只 要 任 一 个 成 分 为 假 (0) ,那么 ,这 一 联合 陈述 就 为 
假 。 TE T 





G Ca CG ° C: 





pä 
oro m= 
O O O =e 


分 离 符 (或 ) 用 符号 “十 ”或 “V "表示 。[20 分 离 式 产 生 一 个 联合 陈述 , 当 任何 
一 个 (或 全 部 ) 组 成 项 为 真 时 ,该 联合 陈述 均 为 真 。 只 有 当 两 者 均 为 假 时 ,联合 
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陈述 才 为 假 。 下 列 真 值 表 表明 了 一 个 复合 陈述 对 其 组 成 成 分 组 合 形式 的 取 值 : 








C Cz QVC 
1 1 1 

1 0 1 

0 1 1 

0 0 0 


否定 式 ( 非 ) 表 示 为 “~”。 否 定式 提供 了 与 任何 为 真 陈述 相反 的 取 值 (简单 
或 联合 陈述 ) 。 它 尤其 重要 , 因为 它 表 示 原 因 不 成 立 (C = 0) 或 结果 不 成 立 
(ŒE =0), [1] 

下 面 举 个 例子 说 明 联合 式 ( 且 )。 我 们 发 现 ,单个 属性 PR( 比 例 代 表 制 ) 并 
非 MPS( 多 党 制 ) 的 充分 条 件 , 且 单个 属性 社会 分 化 程度 (SF) 也 不 是 MPS 的 充 
分 条 件 ,但 联合 属性 “PR H. SF”(PR + SF) 是 MPS 的 一 个 充分 条 件 。 根 据 方法 
2, 我 们 排除 PR 和 SF 作为 单个 属性 是 MPS 的 充分 条 件 ( 个 案 4 中 ,PR 没有 产 
Æ MPS ,个案 5 中 ,SF 没有 产生 MPS). 。 然 而 ,PR 和 SF 同时 出 现 却 是 MPS 的 








充分 条 件 。 
事件 潜在 充分 条 件 结果 
(个 案 ) PR SF PR. SF MPS 





ao A Ww N e 
O P HH FE He 
=. O =e = = 
oO oO = = rR 

O =e me e 


在 布尔 代数 中 ,联合 符 “ 且 ”被 称 为 “乘法 ”, 其 结果 是 一 种 特定 的 因果 条 件 
HE. PR © SF>MPS 可 以 被 写成 : 


MPS = PR + SF 或 MPS = PR SF 


当 PR 和 SF 都 出 现时 ,MPS tH. HATS 1-0 = 00-1 =0 RM. 
如 果 两 个 成 分 只 有 一 个 出 现 ,那么 MPS 就 不 会 出 现 。 只 有 联合 PR 与 SF ,才能 
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导致 MPS, ,而 任 一 单独 成 分 都 不 能 导致 MPS。 这 种 形式 的 联合 陈述 也 可 以 纳 
入 “不 出 现 ” 这 一 属性 。 例 如 ,只 有 当 多 数 票 制 (M) AE SF(~SF) 和 ”无 集中 于 某 
地 的 少数 民族 ”( 一 TCM) 共 同 作 用 ,才能 导致 两 党 制 体系 (TPS): 


TPS = M e~ SF e~ TCM 或 TPS 二 M sf tem 


在 这 种 情况 下 ,大 写字 母 代 表 属 性 成 立 ,而 小 写字 母 代 表 属 性 不 成 立 。 

在 布尔 代数 中 ,分 离 符 “或 ”被 称 为 “加 法 ”, 用 符号 “十 ”表示 。 这 里 ,加 法 代 

只 需 任 一 条 件 成 立 , 那 么 结果 就 会 发 生 。 这 种 形式 的 代数 ,就 是 1 十 1 二 1。 如 
果 我 们 想 知 道 在 某 次 给 定 选 举 中 ,是 什么 导致 了 竞选 失败 (LV) ,我 们 会 发 现 ,很 
多 因素 将 导致 同样 的 结果 ;政绩 差 (PP) .同一 意识 形态 下 有 新 的 平行 党 派出 现 
(CNP) 或 党 派 领袖 的 丑闻 (PS) 。 如 果 任 何 一 个 或 全 部 因素 成 立 ,那么 结果 LV 就 
会 发 生 。 条 件 陈述 PPVNPV PS->~LV 可 被 写成 : 
LV = PP+NP+PS 

其 含义 为 ,政府 政绩 差 、 出 现 新 平行 党 派 或 是 政治 丑闻 都 可 单独 导致 政党 在 选 
举 中 的 失败 (或 全 部 3 个 ,或 任何 2 个 的 组 合 ) 。 

联合 陈述 基于 联合 ( 且 ) ,而 分 离 陈述 则 在 作出 以 下 区 分 时 很 关键 :(1) 充 分 
非 必要 条 件 ; (2) 必要 非 充 分 条 件 ; (3) 既 非 充分 又 非 必要 条 件 ; (4) 充 分 必要 
条 件 。 


分 离 与 多 重 因 果 





首先 是 充分 非 必要 条 件 。 分 离 法 或 布尔 加 法 (或 ) 特 别 重 要 ,因为 它 允 许 把 多 
重 (元 ) 因 采 正 式 化 。 有 了 时候, 经验 证据 表明 某 个 原因 并 非 唯 一 原因 (Zelditch: 
1971: 299)。 分 离 或 加 法 表明 , 某 条 件 可 由 另 一 个 条 件 取代 ,并 产生 同样 的 结果 。 

多 重 因 果 性 可 这 样 表述 :给 定 条 件 Cl 是 结果 五 的 充分 条 件 。 然 而 ,既然 它 
不 是 唯一 可 能 的 原因 ,那么 ,同样 的 结果 可 由 另 一 个 充分 条 件 Cz 引发 。 这 正 是 
分 离 法 (布尔 加 法 ) 所 强调 的 。 其 公式 为 : 


E= C1 FC? 
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根据 原因 来 建立 充分 条 件 ( 方 法 2): 如 果 C1 是 充分 条 件 ,那么 , 当 Cl = 1 
时 ,总 能 发 现 玉 二 1, BPCC |D 三 1, 不 存在 玖 =0 的 情况 , 即 PCC, |~ E) = 0. 
同样 ,如 果 Co 是 充分 条 件 ABA. 4 Co = 1 时 ,总 能 发 现 E=1, 即 P(Cz |E) = 
1, EREE E = 0 的 情况 , 即 PCC |~ E) = 0。 然 后 ,如 个 案 4 和 个 案 5 表明 
的 ,两 者 (Cl 、C2 ) 都 非 必要 条 件 ( 当 Ci = 0 或 Cz = 0 时 ,结果 依然 发 生 ) 。 


NE Ci C: C+ C E 





n A WwW N Fr 
O = = = - 
FOF Fe 
= = = = 一 
=. =. =.“ 


多 重 因 果 代表 了 分 离 式 构 型 (或 ) ,其 中 ,Cl 和 Co 都 是 充分 非 必 要 条 件 。 
联合 与 组 合 因果 


其 次 是 必要 非 充 分 条 件 。 联 合 或 布尔 乘法 ( 且 ) 很 重要 ,因为 它 允 许 把 联合 
因果 正式 化 。 有 时 数据 表明 ,给 定 因素 不 能 单独 产生 某 个 结果 , 而 必须 与 另外 
一 个 因素 联合 。 这 表示 ,一 个 因果 条 件 必 须 与 另 一 个 联合 ,才能 产生 结果 。 

联合 因果 性 可 表示 如 下 :一 个 给 定 条 件 Cl 是 结果 五 的 必要 条 件 。 然 而 , 因 
其 不 是 充分 条 件 , 则 必须 在 另 一 个 必要 条 件 Co 的 伴随 下 ,结果 玉 才 能 发 生 。 这 
可 用 联合 符 表示 。 其 公式 是 : 

E=C:@ 


根据 基于 结果 的 方法 3, 如 果 Ci E E HBA IBA. 4 E = 1 时 ,必然 
RRC =1, BPC | Ð =1, 同时 ,不 会 有 Cl = 0 的 情况 , 即 P(~ Ci | ED 
= 0, 同样 ,如 果 Cz 是 玉 的 必要 条 件 ,那么 , 当 E = 1 时 ,必然 发 现 Cz = 1, 即 
PC: | D = 1, 同时 ,不 会 有 Cz = 0 的 情况 , 即 PC Cz | E) = 0。 如果 这 样 ， 
那么 Ci 和 Cz 都 是 巨 的 必要 条 件 。 不 过 ,如 个 案 4( 对 C1) 和 个 案 5( 对 Cz) 所 表 
明 的 ,它们 两 个 都 不 是 玉 的 充分 条 件 。 


基于 布尔 代数 的 比较 法 导论 





个 案 Cı C: G eCG E 
l 1 1 l l 
2 1 1 1 1 
3 l 1 1 l 
1 1 0 0 0 
5 0 1 0 0 


联合 因果 代表 的 是 连接 性 建构 ( 且 ) ,Cr 和 Co 都 是 必要 非 充 分 条 件 。 
联合 连词 
再 次 是 非 充分 非 必要 条 件 。 举 一 个 更 复杂 的 例子 ,其 中 的 条 件 既 非 充分 又 
非 必要 条 件 , 但 这 些 条 件 的 两 种 组 合 是 结果 下 的 充分 必要 条 件 : 
E = (C1* C2) + (C3 e~ Cy) 


如 果 单 独 取 出 这 4 种 可 能 的 因果 条 件 , 则 没有 一 个 是 充分 的 或 者 必要 的 条 
件 ,如 下 表 所 示 : 





个 案 Ci C Cı ° C Cs C: C3 * ~C. E 
1 l l 1 1 0 l 1 
2 1 1 1 0 1 1 
3 1 l 1 1 0 1 1 
1 0 | 0 0 0 0 l 
5 l 0 0 l 0 1 1 
6 0 1 0 0 1 0 0 
7 l 0 0 1 1 0 0 


首先 ,很 容易 看 出 ,根据 方法 2, 没 有 一 个 单独 条 件 是 可 以 产生 结果 巨 的 充 
分 条 件 , 因 为 当 所 有 Ci 都 出 现时 ,下 也 可 以 不 出 现 ( 最 下 面 两 行 的 个 案 6 和 个 案 
7)。 其 次 ,通过 选择 那些 下 = 1 的 个 案 ( 方 法 3), 即 当 结果 发 生 时 ,可 以 排除 4 个 
作为 必要 条 件 的 Ci ,因为 玉 在 潜在 必要 条 件 都 不 出 现时 ,还 是 出 现 了 (个 案 4 和 
个 案 5)。 在 所 有 4 个 变量 中 , 没 一 个 是 上 这 一 结果 的 充分 或 者 必要 条 件 。 

然而 ,上 表 却 表明 ,Cl 和 Co 的 联合 或 C3 MAE Ci C4 = 0 ) 的 联合 产生 E, 
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组 合 Ci + Cs 和 C e ~C 是 结果 五 发 生 的 充分 条 件 : 当 第 一 对 组 合 出 现时 , 结 
果 就 发 生 ;这 同样 适用 于 第 二 对 组 合 。 然 而 ,这 两 对 组 合 没有 一 组 是 必要 条 件 ， 
因为 当 这 两 对 组 合 不 发 生 ( 个 案 4 和 个 案 5) 时 ,结果 玉照 旧 发 生 。 

最 后 是 必要 和 充分 条 件 。 联 合 与 分 离 法 可 用 于 理解 充分 必要 条 件 。 

充分 条 件 C1 意味 着 ,无 须 通过 联合 其 他 变量 Ci ,就 可 以 产生 结果 E, Ci 
自身 就 可 以 产生 结果 , 即 PCC) | E) = 1A PCC) |~ E) = 0. 

必要 条 件 Cl 意味 着 , 它 不 能 被 其 他 条 件 C 所 取代 而 产生 玉 。C1 必须 总 是 
出 现在 那些 事件 发 生 的 个 案 中 , 即 PCC | E) = 1 A RAA E=0, 即 
P(~ C1 |E) = 0。 用 布尔 代数 表示 就 是 : 


E= 
我 们 用 下 表 来 表示 C1 既是 充分 又 是 必要 条 件 : 


个 案 Ci E 





n eA U N -e 
=e =e = = = 
Pe RP Fe 


简化 数据 


正如 我 们 看 到 的 ,联合 陈述 基于 联结 符 ( 且 ) 和 分 离 符 ( 或 ), 还 有 否定 式 ( 非 ) 
之 间 的 不 同 组 合 (各 项 之 和 )。 这 导致 复杂 且 可 能 很 长 的 陈述 ,因而 有 一 些 逻 辑 
工具 被 用 来 简化 数据 。 

第 一 种 简化 因果 陈述 的 方法 是 最 小 化 。 这 一 工具 排除 了 那些 出 现在 一 个 
因素 组 合 (联合 ) 中 ,但 并 未 在 另 一 个 因素 组 合 (分 离 ) 中 出 现 的 情况 ,否则 组 合 
二 会 等 同 于 组 合 一 。 如 果 两 对 因素 组 合 仅 有 一 个 因果 条 件 不 同 , 且 两 对 组 合 都 
产生 了 结果 (E)( 比 如 ,Cs 在 一 对 组 合 中 出 现 , 但 在 另 一 组 合 中 未 出 现 ) ,那么 ， 
这 一 条 件 可 被 认为 与 结果 不 相关 。 


基于 布尔 代数 的 比较 法 导论 
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以 3 个 因素 Cl C2. C3 为 例 ,它们 同时 出 现 (通过 连词 “ 且 ”) 是 REWE 
分 条 件 。 我 们 设想 ,第 二 对 因素 组 合 (通过 连词 “或 ”也 是 产生 结果 五 的 充分 条 
件 。 然 而 在 第 二 对 组 合 中 ,Cs 并 未 出 现 ( 一 C3)。 由 此 可 有 如 下 联合 陈述 : 
E = (Ci + Co + C3) + (Cy * C2 e~ C3) 
存在 两 对 备 择 的 因素 组 合 ,它们 都 是 结果 上 的 充分 条 件 。 没 有 一 个 因素 Ci 
单独 构成 结果 五 的 充分 ( 见 个 案 4 个 案 5、 个 案 6) 或 必要 条 件 ( 见 个 案 7、 个 案 
8. 个 案 9)。 然 而 ,这 两 对 因素 组 合 形成 了 充分 条 件 ( 但 不 是 必要 条 件 )。 在 第 一 
对 组 合 中 ,3 个 因素 都 出 现 ,因此 , C e C e CG = 1。 在 男 一 对 组 合 中 ,只 有 前 两 
个 因素 出 现 ,而 第 三 个 因素 不 出 现 , 即 C1 .Cz e~ C3 = 1, 


个 案 Q 


Q 


Cs C; © C: ” C3 Cı 


Q 
Q 
Q 
à 
by 





—= = OF = O w eS 
= O =e =e O w w ee 
O = =e e e e O O O 
O O O O O O m m= me 
= = KF O O OF w= me 


Oo won QQ O MA UU N- 
O O O O O O me m m 


1 
1 
1 
0 
1 
1 
0 
1 
1 


KF OF FO Fe dh 
Oo FF OF He Se He Ee 


很 明显 ,Cs 出 现 与 否 ,对 结果 EFTER ATLA AT HERR. AE C3 是 否 出 
现 ,E 还 是 出 现 了 。 则 “原初 ”陈述 就 可 被 简化 成 下 面 这 一 最 简 陈 述 : 


E=C °C 


Ci + Cz 这 一 组 合 就 是 玉 的 充分 条 件 。 

基于 两 对 产生 相同 结果 E 的 因素 组 合 ,最 小 化 逻辑 隐 含 了 很 强 的 实验 性 ， 
即 只 有 一 个 因素 是 变动 的 (在 一 组 合 中 出 现 ,而 在 另 一 个 组 合 中 不 出 现 ) 。 

根据 差异 最 小 设计 框架 下 的 求 异 法 , 当 其 他 因素 都 不 变 时 , 若 唯一 变动 因 
素 的 变动 并 未 导致 结果 变动 ,那么 就 可 把 它 从 因果 性 因素 中 排除 。 
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第 二 个 用 于 简化 因果 陈述 的 工具 是 蕴含 式 , 或 称 “ 主 蕴含 "。 主 北 含 是 最 小 
化 的 陈述 , 且 涵 盖 一 个 以 上 的 原初 陈述 。 在 上 例 中 ,最 小 化 的 主要 蕴含 式 (Cl。 
C2) 同 时 涵盖 了 (C1。Co。，C3) 和 (C1* Cs， ~C3)。 它 被 认为 是 蕴含 的 ,涵盖 或 
包括 后 两 者 。 原 初 陈述 是 主要 陈述 的 一 个 子 集 。(C1*， C e C3) 和 (Cl。 
Cz © ~C) KEC e Cz) 的 子 集 , (Ci * Co + C3) ACC) * Co e ~C3) AR RR LSA 
在 (CI。C2 ) 中 。 

在 部 分 案例 中 ,有 几 个 主 蕴含 式 包括 了 同一 个 原初 陈述 。 主 要 陈述 自身 是 
随机 的 ,并 且 是 最 小 化 的 陈述 ,可 被 进一步 简化 。 这 带 来 了 最 大 的 简约 性 ,这 当 
中 只 有 最 主要 的 蕴含 式 出 现在 因果 陈述 中 。 

VA E 出现 的 4 个 个 案 为 例 ,我 们 希望 确定 3 个 潜在 因果 条 件 是 不 是 充分 
和 /或 必要 条 件 。 在 下 表 中 ,有 4 对 C; PRA CED POE FAIR SRR E. IF BL 
通过 分 离 符 ( 或 ) 联 结 的 都 是 五 必要 条 件 的 备 择 假设 。 





个 案 Ci C C; E 
1 1 0 1 1 
2 0 1 0 1 
3 1 1 0 1 
4 1 1 1 1 


此 表 的 原初 陈述 如 下 , 即 每 一 项 都 对 应 上 表 的 一 行 (一 个 个 案 ) : 
下 王 (C1，。 一 Cz。C3) 十 (一 CI * C2 ¢ ~C3) + (Ci *¢ C2 e ~C3)+ (Ci * C2 •¢ C) 


根据 上 文 讨论 的 最 小 化 原则 : 


1 (Ci » ~C: . C;) 


个 à Ts 

= 4 (G e G aG 最 小 化 为 (CG) 
2 Cs ws sl) 

ü P TE p 

pa 3 G * Cp * ~C3) 最 小 化 为 人 
3 CG d C: . ~C;) 

个 ce 

个 案 4 GG #5 最 小 化 为 (CG eG) 


因此 ,最 小 化 陈述 就 是 : 


基于 布尔 代数 的 比较 法 导论 


E = (Cı + C3) + (Cz e~ C3) + (Ch °» C2) 


这 3 个 主要 蕴含 式 包括 了 以 下 这 些 原初 陈述 : 


(Ci + ~C, + C3) 
(Ci * G) ny 
1 3 包含 了 《人 和 


(~C, g C: o ~C3) 
CO x eh, JA 
+ à 包含 了 (Cy © Go Ey) 


、 ~ rs (1 Cz e ~C;) (已 被 LC2 ? 一 C; JAR) 
We 包含 J (Cr Co GEREG GIAA) 
EE, (Ci © Cz) 就 是 匈 余 的 主要 蕴含 式 , 可 以 被 排除 : 
E = (Ci + C3) + (C2 e~ C3) 

这 意味 着 ,E 是 由 乘法 (C1， C3 ) 或 乘法 (C2“。 一 C3 ) 导 致 的 。 两 组 都 是 的 充 
分 非 必 要 条 件 (每 一 组 都 可 由 其 他 组 合 取代 ) 。 

第 三 种 简化 因果 陈述 的 工具 就 是 因子 分 解 。 更 精确 地 说 ,因子 分 解 可 以 帮 
助 我 们 廓 清 数据 的 结构 ,而 非 简 化 它 。 

首先 ,因子 分 解 有 助 于 强调 必要 条 件 。 在 下 面 的 因果 陈述 中 : 

E = (Cy + C3) + (C2 + C3) 

Cs 是 必要 条 件 ( 但 不 是 充分 条 件 , 见 个 案 6) ,而 Ci 和 Co 既 非 必要 (个 案 7 
和 个 案 8) 又 非 充分 条 件 ( 个 案 4 和 个 案 5) ,如 下 表 所 示 。 相 反 , 两 对 备 择 组 合 
Cl1。C3 Al C2 * C3 WE E WFAA. 


一 
mt 
GY 
Q 
Q 
a 
ô 
Q 
by 





oT DO 入 OOD 
=. Oo O OFF = = 
O m O m OF p pw 
= = =. O O =e Fe 
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对 上 述 因果 陈述 进行 因子 化 就 表明 Cs 是 必要 条 件 : 
E = C; » (Ci +C2) 


其 次 ,因子 化 帮助 我 们 识别 因果 关系 上 等 价 的 充分 条 件 。 在 上 例 中 ,Cl 和 
Cz 是 等 价 的 ,它们 与 C3 的 组 合 产生 了 一 个 不 同 的 组 合 , 而 这 两 对 组 合 都 是 E 
的 充分 条 件 。Cs 与 哪个 条 件 联 合并 不 重要 ( 它 是 等 价 的 ) ,因为 两 种 联合 方式 都 
产生 了 一 个 充分 条 件 。 


超越 二 分 法 : 模糊 集合 与 电脑 程序 


由 于 布尔 逻辑 是 一 种 把 所 有 取 值 都 降格 为 或 “ 真 ” 或 “ 假 ” 的 代数 形式 ， 
因而 它 在 计算 机 科学 0/1 比特 系统 的 发 展 过 程 中 起 了 重要 作用 。 很 自然 ， 
在 一 些 领域 中 ,基于 二 分 变量 的 必要 和 充分 条 件 分 析 发 展 起 来 ,尤其 在 语言 
学 和 内 容 分 析 领 域 (Zadeh，1965) , 另 一 些 则 在 网 络 搜索 引擎 技术 方面 。 最 
初 基 于 二 分 的 0/1 系统 的 方法 进化 到 考虑 各 项 频数 ,允许 它们 加 权 信 息 和 
转化 系统 ,以 容纳 定 序 的 或 “模糊 ”数据 (Kraft，Bordogna & Pasi, 1994; 
Meadow，1992) 。 

在 社会 科学 中 , 拉 津 以 电脑 程序 进行 布尔 分 析 的 探索 性 工作 正 是 追随 这 一 进 
展 的 行为 。 拉 津 与 他 的 合作 者 设计 的 二 分 变量 的 电脑 程序 一 一 定性 比较 方法 
(QCA) 一 一 正 是 以 电子 工程 师 在 20 世纪 50 年 代 发 明 的 算法 为 基础 的 (Drass & 
Ragin, 1986, 1992; McDermott，1985) 。 最 近 ,一 个 新 的 软件 又 问世 了 (Ragin， 
Drass & Davey, 2003; Ragin & Giesel，2003), 它 把 模糊 集合 纳入 了 分 析 (FS/ 
QCA)。 这 两 种 方法 被 广泛 地 应 用 于 研究 中 。[22] 

从 二 分 变量 (0/1) 转 向 定 序 和 间距 (或 比例 ) 变 量 时 ,建立 充分 和 必要 条 件 的 
原则 与 规律 并 无 变化 。 比 较 方法 的 目标 就 是 以 单个 性 质 或 者 更 典型 一 点 ,以 构 
型 方式 (通过 特定 属性 的 组 合 ) 来 发 现 充 分 和 /或 必要 条 件 。 这 种 建构 无 论 是 从 
0/1 变量 中 得 来 ,还 是 从 定 序 变 量 中 得 来 ,评估 它们 是 否 为 某 结果 发 生 的 充分 或 
必要 条 件 的 方法 并 未 改变 。 


基于 布尔 代数 的 比较 法 导论 | 


“国家 形成 ”这 一 变量 的 操作 化 如 下 :“ 早 于 1815 年 (1)”“ 在 1815 年 和 
1914 年 之 间 (2)”“ 第 一 次 世界 大 战 之 后 (3)”。 这 一 变量 可 与 “工业 化 ?这 一 变 
量 采用 相似 的 操作 化 组 合 :工业 化 “ 早 于 1870 年 (1)”“ 在 1870 年 和 1914 年 之 
间 (2)”“ 第 一 次 世界 大 战 之 后 (3)”。 因 此 ,就 有 9 种 可 能 的 组 合 。 利 用 上 述 方 
法 ,我 们 可 以 检验 哪 种 组 合 是 高 水 平 国家 整合 的 必要 或 充分 条 件 。 这 些 组 合 可 
通过 间距 或 者 比例 变量 来 操作 化 ,比如 ,成 年 人 口 的 识字 率 或 者 城市 人 口 密度 
水 平 。 

最 近 , 有 一 种 超越 二 分 法 的 方法 , 即 “ 模 糊 集 合法 ”(Mahoney,，2000、2003; 
Ragin，2000) 。 与 传统 的 明确 集合 方法 不 同 ( 个 案 在 经 典 分 类 中 取 值 是 0 或 1)， 
模糊 集合 允许 个 案 处 于 0 和 1 之 中 。 比 如 ,在 一 个 明确 分 类 中 ,一 个 家 庭 是 “经 
济 上 安全 的 ”或 是 不 安全 的 。 在 一 个 模糊 集合 中 ,一 个 家 庭 可 以 在 经 济 上 “ 差 不 
多 ”是 安全 的 , 即 0. 85, 亦 即 部 分 是 经 济 安全 的 ,但 又 不 完整 。 模 糊 集 合 归属 度 
分 数 根据 它们 归属 于 集合 的 程度 而 确定 。 美 国 并 不 完全 属于 “民主 ”, 但 差不多 
是 “民主 ”的 (美国 的 民主 分 数 是 0. 80) (Ragin, 2000; 176)。 这 提供 了 一 个 额外 
的 方法 对 数据 进行 归 类 ,如 家 族 相似 性 和 向 心 分 类 。 

“变量 取向 ”的 研究 分 类 是 从 个 案 取 值 中 被 创造 出 来 的 (安全 的 社区 是 那 种 
犯罪 率 低 于 5% 的 社区 ;经 济 上 安全 的 家 庭 是 那些 收入 在 4 万 美元 以 上 的 家 
庭 ) ,而 模糊 集合 “测度 ” 则 根据 属于 某 个 类 别 的 程度 来 对 个 案 赋值 。 这 是 一 个 
根据 某 个 给 定 属性 对 个 案 赋 值 的 方法 ,而 研究 者 对 特定 个 案 的 知识 在 赋值 过 程 
中 扮演 着 重要 的 角色 。 

最 后 ,利用 0/1 数据 ,通过 操作 符 或 “联结 词 " 一 一 “ 非 ”“ 且 ”和 “或 ”形成 联 
合 陈述 同样 是 最 重要 的 。 在 这 方面 ,模糊 集合 法 与 传统 的 明确 集合 法 存在 一 些 
区 别 (Ragin，2000: 171 一 178)。 下 面 将 讨论 条 件 陈述 正式 化 过 程 的 差异 。 我 
们 不 讨论 如 何 给 个 案 赋值 。 


必要 与 充分 条 件 


然 成 立 。 如 果 “ 战 争 失 利 ” 对 “社会 革命 ”而 言 是 必要 的 , 那 就 不 可 能 在 没有 “战争 
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失利 ”的 情况 下 发 生 一 场 社会 革命 , 即 PC~ C | E) = 0。 然 而 ,有 可 能 “战争 失 
利 ” 发 生 了 ,但 没有 社会 革命 发 生 (“ 战 争 失利 并非 充 分 条 件 )。 因 此 ,如 果 所 有 
事件 EE = 1, BAUMA C= 1; AMAR E = 0, m C= 1, IA E= 1 就 是 C= 
1 的 一 个 子 集 。 试 想 有 15 个 国家 ,其 中 10 个 采取 比例 选举 制 (PR) ,而 其 中 又 有 8 
个 是 多 党 制 (MPS) ,2 个 是 两 党 制 (TPS)。 所 有 的 MPS 都 有 PR, 即 P~ C | E) = 
0, 但 不 是 所 有 的 PR 都 导向 MPS( 有 2 个 两 党 制 例外 )。 那 么 , MPS = 1 ( 因 变 
量 ) 就 是 PR = 1 ( 自 变量 ) 的 一 个 子 集 。 

如 果 离 散 取 值 0 和 1 都 可 被 两 个 极端 值 之 间 的 模糊 集合 取 值 所 取代 (比例 
选举 制 的 程度 和 党 派 的 数量 ) ,那么 这 一 逻辑 并 未 改变 。 如 果 高 比例 制 是 党 派 
数量 多 的 必要 条 件 , 那 么 ,我 们 必然 找 不 到 高 党 派 数 量 与 低 比例 制 水 平 并 存 的 
国家 , 即 PCC | E) = 0。 另 一 方面 ,所 有 那些 存在 更 多 党 派 的 国家 ,必然 有 高 
比例 的 代表 制 , 即 POC | E) 一 1。 然 而 ,也 可 能 有 很 高 的 比例 制 ,但 只 有 少数 党 派 
的 国家 (因为 比例 制 是 多 党 派 的 必要 非 充分 条 件 )。 如 前 面 讲 的 ,多 党 派 这 一 事 
件 是 高 比例 代表 制 的 一 个 子 集 。 

下 面 的 散 点 图 描述 的 是 C( 比 例 代表 制 ) 是 多 党 派 的 一 个 必要 条 件 ( 用 。” 
表示 ) 时 的 情况 。 当 研究 者 发 现 结果 的 分 数 比 原因 的 分 数 小 (或 相等 ) 时 ,就 可 

以 总 结 说 ,我 们 展示 的 是 一 个 必要 条 件 。 

如 果 C EHR E 的 一 个 充分 条 件 , 那 么 ,对 所 有 C 出 现 的 个 案 而 言 ,E 都 必 
然 出 现 。 如 果 “ 战 争 失 利 ” 是 “社会 革命 ”的 充分 条 件 , 那 么 就 不 会 有 “战争 失利 ” 
却 不 出 现 “ 社 会 革命 ”的 例子 存在 , 即 PC | ~ E) = 0。 然而 ,我 们 可 能 会 发 现 有 
出 现 社 会 革命 , 却 不 存在 战争 失利 的 国家 。 战 争 失利 并 非 必要 条 件 ,同样 的 结 
果 可 由 不 同 的 因素 引发 ,比如 “镇 压 性 体制 ”~ 如 果 所 有 个 案 C = 1 都 必须 有 
E=1, 但 可 能 存在 = 1 而 C==0 的 情况 。 因此, C 1 就 是 EE 二 1 的 一 个 子 
集 。 试 想 有 15 个 国家 ,其 中 10 个 有 MPS, EX 10 个 国家 中 ,又 有 8 个 国家 有 
民族 多 样 性 (FRAG), 而 有 2 个 国家 是 同 质 民族 。 那 么 ,所 有 FRAG 都 带 来 
MPS, 即 P(C | E) = 1, 但 不 是 所 有 MPS 都 需 有 FRAG (有 两 个 例外 )。 
FRAG 王 1( 自 变量 ) 就 是 MPS = 1 ( 因 变 量 ) 的 一 个 子 集 。 
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巨 的 模糊 归属 度 分 数 





0.0 0.5 1.0 
C 的 模糊 归属 度 分 数 


用 模糊 取 值 取代 离散 变量 ,民族 多 样 性 程度 高 就 是 多 党 派 的 充分 条 件 , 因 
此 ,我 们 不 会 发 现 有 民族 多 样 性 高 而 党 派 少 的 国家 , 即 PCC | ~ E) 一 0。 然 而 ,我 
们 可 以 发 现 党 派 多 却 并 无 民族 多 样 性 的 国家 (因为 FRAG 并 非 必 要 条 件 ,可 以 
被 其 他 因素 ,如 PR 取代 )。 因 此 ,民族 多 样 性 是 多 党 派 的 一 个 子 集 。 

如 果 C 是 多 党 派 的 充分 条 件 , 那 么 ,其 取 值 在 理论 上 的 分 布 用 符号 “COC” 在 
散 点 图 中 表示 。 当 研究 者 发 现 那些 结果 取 值 大 于 或 等 于 原因 的 取 值 时 ,就 可 能 
得 出 结论 说 ,我 们 展示 的 是 一 个 充分 条 件 。 


复合 陈述 


如 上 所 述 ,我 们 的 讨论 局 限于 3 个 主要 符号 , 即 “ 非 “上 且 ”和 “或 ”。 
第 一 ,“ 非 ”。 在 数据 库 中 ,如 果 存 在 二 分 变量 ,那么 ,“ 非 ”就 是 相反 的 取 值 :0 
的 “ 非 ” 就 是 1, 反之 亦 然 。 在 模糊 集合 中 ,“ 非 ” 指 1 减 去 模糊 归属 度 分 数 : 


集合 A 中 的 非 模糊 归属 度 分 数 = 1 一 [集合 A 中 的 模糊 归属 度 分 数 ] 


例如 ,如 果 英 国 在 “比例 代表 制 ”(PR) 这 一 集合 中 的 模糊 归属 度 分 数 是 
0. 10, 那 么 ,其 “ 非 ”( 即 在 集合 “ 非 PR 体制 "中 的 模糊 分 数 就 是 0. 90) : 


~ 0.10 = 1—0. 10 = 0. 90 


| 
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下 表 在 一 Cl 栏 给 出 了 非 C1 的 分 数 。 

第 二 ,“ 且 ”。 在 二 分 变量 数据 库 中 ,“ 且 ”发 生 是 指 几 个 因素 必须 都 成 立 , 才 
能 产生 一 个 结果 (C1， Cz)。 这 两 个 因素 都 必须 取 值 为 1 才能 产生 结果 。 在 模 
糊 数 据 库 中 ,个 案 可 能 在 C 和 Cz 所 代表 的 不 同 集合 中 具有 不 同 程度 的 归属 度 
分 数 ( 亦 见 下 表 )。 那 么 ,个 案 的 模糊 归属 度 分 数 在 “联合 集合 ”中 的 分 数 , 取 的 是 
两 者 中 最 小 的 分 数 。 





por PR FRAG 非 且 或 

| gc G -Ëi GG E+6G 
w 国 0. 10 0. 40 0. 90 0. 10 0. 40 
比利时 0. 95 0. 80 0. 05 0. 80 0. 95 
意大利 0. 40 0. 20 0. 60 0. 20 0. 40 


再 次 考虑 一 个 关于 MPS 原因 的 陈述 。 在 二 分 变量 数据 库 中 ,一 个 假设 是 
说 ,PR 和 FRAG 的 组 合 是 产生 MPS 的 充分 条 件 , 即 PR. FRAG = MPS, 如 果 
两 者 都 出 现 ,那么 MPS 也 出 现 。 为 确定 一 个 国家 是 否 属于 同时 具有 PR 和 
FRAG 两 个 特征 的 集合 (国家 ) ,我 们 取 最 小 值 。 

如 果 一 个 国家 ,比如 ,美国 或 者 意大利 ,在 下 表 中 ,PR 取 值 为 0, 民族 多 样 性 
取 值 为 1, 那么 ,联合 陈述 PR. FRAG = 0, BÆ PR = 0 #1 FRAG = 1 FRAG 
最 小 的 值 。 这 同样 适用 于 模糊 集合 取 值 。 假 设 有 一 个 国家 ,如 上 表 中 的 英国 ， 
其 在 PR 模糊 集合 上 取 值 是 0. 10, 在 FRAG 上 取 值 是 0. 40。 在 此 情况 下 ,其 在 
既是 比例 代表 制 , 又 是 民族 多 样 性 的 国家 集合 中 的 分 数 就 是 0. 10。 








A & PR FRAG 非 且 或 

| G G ~C, G.C Ci 十 C 
美 国 0.00 1:00 1.00 0. 00 1. 00 
印 度 0. 00 1. 00 1. 00 0. 00 1. 00 


第 三 ,“ 或 ”。 分 离 符 是 男 一 个 用 于 复合 陈述 的 常见 符号 。 在 传统 的 数据 集 
合 中 ,分 离 符 是 指 一 个 或 男 一 个 因素 出 现 ,就 可 以 产生 结果 (Ci + Cz ) 。 BDA 
一 个 因素 必须 取 1, 才 能 产生 结果 ,但 不 必 两 个 同时 取 1。 在 模糊 数据 集合 中 ,个 
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案 可 能 在 由 C1 和 Cz 代表 的 集合 中 具有 不 同 程度 的 分 数 。 与 联合 符 相反 ,在 数 
个 因素 的 分 离 集合 中 ,模糊 归属 度 分 数 是 取 其 最 大 的 归属 度 分 数 。 

还 是 用 上 面 的 例子 ,我 们 假设 联合 陈述 PR 或 多 成 员 选区 (MM) 是 MPS 的 
必要 条 件 , 或 是 PR ,或 是 MM, 但 不 必 两 者 同时 出 现 (PR 十 MM = MPS). 即使 
选举 程序 是 多 数 制 ,而 非 PR, 但 选区 规模 较 大 会 有 同样 的 “比例 化 ”效果 。 然 
而 ,如 果 两 者 都 不 出 现 ,那么 结果 就 不 会 发 生 。 

比如 ,英国 在 19 世纪 时 ,大 部 分 选区 是 多 成 员 的 , 即 PR 分 数 是 0, 而 MM 
分 数 为 1, 那么 ,复合 陈述 分 数 就 是 1 (PR 十 MM) , 即 PR = 0 #1 MM = 1 两 者 
中 的 较 大 值 。 当 我 们 用 模糊 分 数 取 代 离 散 变 量 时 ,这 同样 适用 。 假 设 有 一 个 国 
家 ,比如 英国 ,其 在 PR( 比 例 选举 制 集合 ) 上 的 模糊 归属 度 分 数 是 0. 10, 在 MM 
(在 多 地 区 选区 国家 集合 ) 上 取 值 是 0. 70。 在 此 情况 下 ,英国 在 有 PR 或 有 多 成 
员 选 区 的 集合 中 的 分 数 就 是 0. 70。 

如 前 面 所 讨论 的 ,通过 这 些 操作 符 ,我 们 可 使 用 必要 和 充分 条 件 来 正式 化 
复合 因果 陈述 。 这 些 技术 ,特别 是 当 它 们 得 到 电脑 软件 的 帮助 时 ,就 能 作出 更 
复杂 的 分 析 , 远 远 超过 此 处 展示 的 基本 原则 。 
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为 何 进行 比较 ? 因为 我 们 可 以 通过 比较 控制 变异 。 首 先 ,通过 比较 ,我 们 
可 在 不 同 个 案 的 某 些 属性 上 发 现 一 些 差 异性 和 相似 性 。 不 进行 比较 的 话 , 诸 如 
“人 口 密集 ”这 类 描述 性 的 陈述 就 毫 无 意义 。 无 论处 理 名 义 的 、 定 序 的 ,还 是 定 
距 的 测度 ,只 有 通过 比较 ,类 型 .顺序 和 数量 才能 确立 。 而 正 是 共享 属性 取 值 的 
比较 ,允许 我 们 识别 相似 性 和 差异 ,并 发 现 其 随时 间 推 移 而 发 生 的 变化 。 其 次 ， 
比较 方法 允许 我 们 控制 解释 性 陈述 ,并 系统 性 地 利用 经 验证 据 检 验 那 些 以 “如 
果 …… 那 么 …… 形 式 出 现 的 有 关 社 会 现象 因果 关系 的 假设 。 若 没有 比较 ,无 
论 你 使 用 的 方法 是 密 尔 法 ,布尔 代数 ,还 是 统计 方法 ,都 不 可 能 对 变量 间 的 关联 
进行 检验 。 在 此 意义 上 ,个 案 取向 方法 与 变量 取向 方法 并 无 本 质 区 别 。 
比较 什么 ? 一 切 都 是 可 比 的 ,并 没有 什么 逻辑 限定 什么 是 可 比 的 。 首 先 ， 
比较 方法 适用 于 所 有 类 型 的 研究 单位 (比如 ,地 域 单位 ,组 织 或 者 个 体 )。 其 次 ， 
在 选择 个 案 时 ,并 无 空间 和 时 间 的 限制 。 只 要 我 们 不 是 比较 个 案 本 身 ,而 是 个 
案 间 共 享 (共同 ) 属 性 ,那么 ,所 有 个 案 都 是 可 比 的 。 这 一 点 同样 适用 于 布尔 代 
数 技术 和 统计 学 方法 。 
如 何 进 行 比较 ? 我 们 通过 逻辑 进行 比较 。 第 一 ,分 类 学 处 理 允 许 我 们 定义 
能 够 “旅行 ”的 概念 ,并 使 个 案 可 比 。 第 二 ,分 类 法 允许 我 们 把 研究 关注 的 因果 
关系 从 那些 研究 者 希望 控制 的 其 他 因素 中 分 离 出 来 。 第 三 ,逻辑 方法 是 从 密 尔 
的 求 同 法 和 求 异 法 或 统计 学 方法 中 发 展 出 来 的 ,它们 提供 了 严谨 的 技术 来 建立 
现象 间 关 联 陈述 的 经 验 有 效 性 。 第 四 ,逻辑 连词 ( 且 、 或 , 非 ) 允 许 研 究 者 组 合 不 
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同 的 自 变量 来 为 每 个 个 案 构 建 不 同 的 因素 组 合 与 构 型 。 第 五 ,逻辑 方法 允许 用 
必要 和 /或 充分 条 件 的 术语 来 建立 因果 关联 的 陈述 。 


比较 法 的 优势 


比较 通常 被 认为 是 一 种 最 重要 的 认识 世界 的 智力 工具 。 几 个 世纪 以 来 , 逻 
辑 哲学 家 们 都 把 比较 法 放 在 他 们 认识 论 的 中 心地 位 。 比 较 是 所 有 方法 的 核心 : 
实验 方法 (通过 比较 试验 组 和 控制 组 )、 统 计 方法 (通过 比较 列 联 表 中 的 不 同 组 
别 或 者 方差 分 析 ) ,以 及 在 最 近 20 年 发 展 起 来 的 小 样本 研究 和 布尔 代数 方法 ( 基 
于 密 尔 的 求 同 求 异 并 用 法 )。 

比较 方法 最 明显 的 优势 在 于 , 它 使 社会 科学 成 为 可 能 。 在 统计 分 析 中 , 比 
较 通 常 与 跨国 差异 模型 联系 在 一 起 一 一 以 国家 层面 的 属性 (变量 ) 作 为 控制 或 
情境 变量 。 在 此 意义 上 ,比较 使 那些 跨国 的 或 者 跨 时 间 的 (如 果 比 较 的 是 不 同 
时 点 的 单位 ) ,或 者 跨 组 织 的 (如 果 比 较 的 是 不 同 对 象 ,比如 ,制度 、 社 会 关联 、 部 
落 等 等 ) 变 异 有 意义 。 用 布尔 代数 来 分 析 稀 有 现象 和 少数 个 案 的 技术 有 特别 的 
优势 。 

从 消极 的 角度 看 , 当 “ 不 利 条 件 ” 使 其 他 方法 ,比如 实验 法 和 统计 法 ,难以 被 
运用 时 ,布尔 技术 依然 可 提供 一 个 坚实 且 人 逻辑 严谨 的 备 择 方法 。 布 尔 比 较 方 法 
可 以 比 其 他 方法 更 好 地 处 理 那 些 涉 及 过 度 决定 的 研究 问题 (因为 “样本 太 小 , 变 
量 太 多 ”) 以 及 那些 涉及 质 性 属性 、 二 分 变量 和 那些 有 和 较 高 风险 且 是 决定 性 而 非 
概率 性 的 陈述 。 那 些 “ 不 利 环 境 ” 不 应 当 被 归罪 于 布尔 方法 本 身 。 与 其 因 其 处 
理 情况 的 不 利 而 把 布尔 方法 看 做 弱 的 方法 ,不 如 这 么 看 :尽管 布尔 方法 不 能 像 
统计 系数 那样 提供 结论 所 需 的 测度 ,但 布尔 方法 的 优势 正在 于 ,在 其 他 方法 都 
失败 的 情况 下 , 它 依然 可 处 理 这 些 问题 。 

问 时 ,从 积极 的 视角 看 ,基于 逻辑 代数 的 比较 方法 有 一 些 独特 的 优势 。 我 
们 通常 认为 ,比较 方法 的 优势 如 下 :(1) 区 分 充分 和 必要 条 件 的 能 力 , 即 一 种 超 
越 现 象 间 单 纯 关 联 性 的 因果 逻辑 ;(2) 处 理 多 重 因 果 性 的 能 力 ;(3) 模型 化 独立 
因素 的 能 力 ,比如 属性 的 组 合 与 构 型 。 
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不 同方 法 的 整合 路 径 


如 果 我 们 考虑 的 是 根本 性 原则 ,比如 ,通过 相关 性 和 控制 来 检验 逻辑 关系 ， 
那么 ,不 同方 法 之 间 存 在 着 相似 性 。 另 外 ,我 们 也 能 发 现 统计 方法 和 比较 方法 
越 来 越 多 的 共同 点 ,因为 它们 各 自 处 理 了 其 他 方法 无 法 处 理 的 问题 。 最 近 , 围 
绕 统计 学 如 何 处 理 多 重 因果 性 、 组 合 性 解释 、 定 类 变量 以 及 比较 方法 如 何 处 理 
连续 数据 和 概率 性 解释 ,产生 了 一 些 争 论 。 事实 上 ,这 两 种 方法 之 间 的 共通 性 
比 通常 想象 的 要 多 得 多 。 

关于 两 者 之 间 的 整合 ,有 3 种 主要 的 观点 。 


组 合 性 解释 


人 们 经 常 宣称 ,统计 学 不 能 包括 组 合 性 或 者 构 型 性 类 型 的 解释 , 列 联 表 、 双 
向 方差 分 析 以 及 对 数 线性 模型 分 析 表 明 , 这 一 逻辑 同样 出 现在 统计 技术 中 。 同 
样 ,布尔 代数 等 方法 允许 我 们 评估 到 底 是 哪 类 自 变 量 D 的 取 值 组 合 导致 某 个 结 
果 ( 比 如 ,一 个 因 变 量 的 具体 取 值 )。 多 变量 列 联 表 或 许 是 在 组 合 性 解释 方面 最 
接近 布尔 代数 的 统计 技术 。 

进言 之 ,在 多 元 回归 分 析 中 ,交互 作用 等 同 于 组 合 性 。 只 有 当 另 一 个 自 变 量 
X: 值 给 定时 , 自 变 量 Xi 取 值 的 变化 对 因 变量 Y 才 有 影响 。 在 此 意义 上 ,交互 性 
因果 关系 确实 处 理 了 因果 性 的 组 合 类 型 (Jaccard & Wan, 1996; Jaccard & 
Turrisi, 2003), 


定 类 变量 分 析 


这 同样 适用 于 定 类 变量 分 析 。 统 计 学 提供 了 一 些 方 法 来 处 理 名 义 的 、 定 类 
的 测度 (甚至 是 二 分 变量 )。 因 此 , 它 就 与 布尔 代数 的 另 一 个 特殊 性 结合 在 一 
起 。 列 联 表 是 比较 分 析 中 常用 的 统计 分 析 技 术 , 因 为 它们 允许 研究 者 处 理 名 义 
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和 定 类 变量 。 在 广义 的 历史 比较 研究 中 ,这 些 变 量 往往 是 主要 的 数据 类 型 。 

在 此 ,需要 提 到 另 一 项 技术 , 即 虚 拟 变量 回归 (Hardy，1993)。 举 例 来 说 ， 
如 果 有 一 个 名 义 自 变量 一 一 5 种 宗教 团体 一 一 在 回归 分 析 中 ,我 们 需要 选择 一 
种 宗教 作为 参照 组 ,并 对 其 余 宗 教 赋值 :如 果 属 于 这 一 类 ,赋值 为 1; 不 属于 这 一 
类 ,赋值 为 0。 因 此 ,对 于 每 一 种 宗教 ,都 有 一 个 虚拟 变量 对 应 。 用 虚拟 变量 方 
法 进行 回归 的 好 处 是 ,其 结果 总 是 包括 自 变 量 每 一 个 类 别 的 精确 效果 (名 义 变 
量 的 类 别 变 成 了 多 个 虚拟 变量 ), 而 方差 分 析 和 列 联 表 方法 都 只 能 局 限于 自 变 
量 的 总 体 效 果 。 

最 后 ,对 数 线性 分 析 或 许 是 最 重要 的 定 类 变量 分 析 技术 (Ishii-Kuntz， 
1994; Knoke & Burke,，1980) 。 对 数 线性 模型 的 特殊 例子 是 logit 模型 (或 者 是 
multinomial logistic 回归 ) 和 porbit 模型 ,它们 处 理 的 都 是 二 分 变量 (Aldrich & 
Nelson, 1984; DeMaris, 1992; Kant Borooah, 2001; Liao, 1994; Menard, 
2001; Pampel，2000) 。 对 数 线性 模型 分 析 被 认为 是 列 联 表 ”“ 回 归 风 格 ? 的 延续 ， 
可 容纳 更 多 变量 (变量 太 多 会 使 列 联 表 不 可 读 , 且 难 以 理解 )。 这 一 技术 允许 我 
们 决定 哪 种 自 变量 组 合 对 因 变量 具有 更 强 的 效果 。 在 此 意义 上 ,对 数 线性 分 析 
非常 接近 于 比较 方法 中 的 构 型 性 和 组 合 性 的 本 质 。 不 仅 如 此 ,作为 回归 分 析 的 
变异 ,对 数 线性 模型 还 分 析 评估 每 一 种 组 合 的 效果 。 

总 结 一 下 ,如 果 我 们 一 方面 考虑 诸如 多 变量 列 联 表 、 双 向 方差 分 析 、 对 数 线 
性 分 析 以 及 交互 作用 ,而 另 一 方面 考虑 概率 性 的 、 由 布尔 代数 进化 而 来 的 模糊 
集合 分 析 , 那 么 ,这 两 种 方法 (统计 方法 、 比 较 方法 ) 根 本 没 多 大 差异 。 


概率 性 关系 


布尔 比较 方法 是 不 是 决定 性 的 ? 有 些 作者 提出 , 求 同 法 与 求 异 法 必然 导致 
决定 性 的 结果 ,而 统计 方法 是 概率 性 的 (Goldthorpe, 1997a, 1997b, 2000; 45— 
64; Lieberson，1992、1994、1998) 。 在 此 ,我 们 看 到 ,差别 并 不 如 他 们 强调 的 那 
么 大 : 

首先 ,如 果 给 定 因素 出 现 , 总 是 导致 特定 结果 的 出 现 (“X1” 成 立时 , 则 有 
“Y”) ,那么 这 一 因果 命题 就 被 认为 是 决定 性 的 。 只 要 有 一 个 个 案 与 假设 的 关系 
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不 符 , 就 可 以 推翻 它 。 而 这 种 与 假设 相反 个 案 的 存在 ,使 我 们 得 出 ,“X1” 对 “Y” 
没有 影响 。 此 时 的 关系 不 变 , 是 完美 关联 的 (相关 系数 是 士 1. 0) 。 

其 次 ,如 果 给 定 因素 出 现时 ,特定 结果 出 现 的 可 能 性 增加 ( 当 “X1” 时 , 则 “Y” 
出 现 的 概率 或 者 频数 增加 ) ,那么 这 一 因果 命题 就 被 认为 是 概率 性 的 。 一 两 个 
反例 并 不 能 拒绝 因果 关系 假设 。 拒 绝 假设 依赖 于 频数 的 分 布 (研究 者 在 “Hi1” 和 
“虚无 假设 ”两 者 之 间 选 择 )。 概 率 性 命题 基于 不 完美 的 因果 关联 性 (相关 系数 
在 土 1.0 之 间 )。 

社会 科学 中 并 不 存在 决定 性 关系 。 持 有 这 种 “天 真 概念 (的 人 ), 并 不 会 走 
得 太 远 ”(Galtung，1967: 505)。 决 定性 命题 在 社会 科学 中 特别 不 切实 际 ,因为 
有 以 下 因素 存在 :(1) 数 据 本 质 一 一 复杂 的 多 变量 因果 模式 ; (2) 测 量 误差 
一 组 数据 偏离 假设 可 能 是 由 于 测量 误差 ,而 并 非 关 系 不 成 立 ;(3) 不 可 能 控制 所 
有 变量 一 一 研究 者 只 能 尝试 控制 那些 他 们 认为 从 理论 上 讲 或 许 有 作用 的 重要 
因素 ;(4) 偶 然 性 一 一 由 于 巧合 导致 的 关系 。 因 此 ,从 决定 性 命题 通过 “概率 性 革 
命 ” 转 向 非 决 定性 命题 是 社会 科学 的 一 大 进步 (Kriger，Gigerenzer & Morgan, 
1987; Lieberson, 1985; 94 一 97) 。 在 社会 研究 中 ,研究 者 根据 正面 案例 反面 案 
例 的 频数 接受 或 拒绝 假设 。 

那些 在 小 样本 研究 中 应 用 密 尔 法 的 研究 者 ,都 认为 密 尔 前 两 个 或 前 三 个 方 
法 是 决定 性 的 。 对 拉 津 来 说 ,“( 求 异 法 ) 被 用 于 建立 无 变异 的 模式 ,不 完美 的 ( 比 
如 ,概率 的 ) 关 系 属于 统计 理论 的 领域 ”, 并 且 ”* 它 们 被 设计 来 发 现 无 变异 模式 和 
不 变 的 关联 ”(Ragin, 1987: 39 一 40、51) , 即 不 变 的 因果 构 型 是 必要 的 (而 韭 可 
能 的 ) 组 合 , 它 导致 某 些 结果 (Ragin & Zaret，1983: 743 一 744) 。 对 斯 考 切 波 来 
说 ,同样 ,“ 与 概率 性 技术 的 统计 分 析 相 比 …… 比 较 历 史 分 析 …… 尝 试 识别 不 变 
的 因果 关系 ,那些 必要 的 (而 非 可 能 的 ) 组 合 导致 我 们 感 兴趣 的 结果 ”(Skocpol. 
1984a: 378) 。 

然而 ,布尔 逻辑 只 适用 于 变量 间 决 定性 关系 的 想法 并 不 恰当 。 事 实 上 ,这 
并 非 其 内 在 逻辑 。 逻 辑 方法 不 能 独一无二 地 与 决定 性 命题 联系 在 一起。 在 频 
数 分 布 中 , 某 因 素 被 接受 为 充分 或 必要 条 件 ,并 非 因为 没有 个 案 与 假设 冲突 .而 
是 因为 这 些 反例 很 少 。 比 较 研 究 可 基于 频数 分 布 ,在 其 中 ,接受 或 拒绝 必要 或 
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充分 条 件 并 非 依靠 条 件 在 所 有 事件 中 的 出 现 / 不 出 现 ,而 是 它们 在 进行 比较 的 
众多 个 案 中 出 现 / 不 出 现 的 多 少 。 如 果 建 立 的 置信 水 平 是 n( 即 我 们 认为 可 接受 
虚无 假设 的 个 案 数 量 ) ,那么 , 当 正 面 案例 数量 <n 时 ,我 们 接受 虚无 假设 ; 当 正 
面 案例 数量 三 n 时 ,我 们 拒绝 虚无 假设 (接受 备 择 假设 ) 。 

接受 或 者 拒绝 一 个 原因 是 否 成 立 的 水 平 (n) 是 武断 地 设 定 的 ,临界 点 完全 
在 研究 者 的 掌握 之 中 。 利 用 统计 方法 ,研究 者 武断 地 决定 自 变 量 和 因 变 量 的 关 
系 是 “ 强 ” 还 是 “ 弱 ”( 举 例 来 说 ,在 社会 科学 中 ,皮尔 逊 相关 系数 ~ = 0. 30 通常 被 
认为 是 强 相 关 )。 临 界 点 很 明显 受到 个 案 数量 的 影响 。 戈 德 索 普 (Goldthorpe) 
和 利 伯 森 (Lieberson) 正 确 地 提出 ,有 些 方 法 之 所 以 是 决定 性 的 ,并 非 因为 求 同 
法 、 求 异 法 的 逻辑 本 身 如 此 ,而 是 因为 个 案 数 量 ( 小 样本 问题 ) 。 总 的 来 说 , N 的 
数目 越 小 ,一 个 反例 就 越 可 能 导致 假设 被 拒绝 。 若 总 共有 两 个 个 案 ,那么 ,一 个 
反例 就 导致 完全 的 不 确定 性 (50%) ;而 10 个 个 案 中 只 有 一 个 反例 就 “好 多 了 ”。 
利 普 哈 特 反对 ”给予 反面 发 现 以 过 分 重要 性 的 廖 误 ,但 他 同样 认识 到 ， 在 小 样 
本 个 案 的 比较 分 析 中 ,一 个 偏离 个 案 就 会 显得 很 突出 ”(Lijphart，1971: 
686) .L23] 

在 此 过 程 中 ,偏离 个 案 扮 演 了 重要 的 角色 。 它 们 弱化 了 假设 ,但 并 未 使 假 
设 变 得 无 效 。 偏 离 个 案 分 析 是 利 普 哈 特 辨别 出 来 的 6 种 个 案 分 析 方 法 之 一 
(Lijphart, 1971; 691 一 693) 。 个 案 研 究 作 为 方法 ,其 地 位 模糊 是 因为 它 不 是 一 
个 概括 性 的 行为 。 对 许多 人 而 言 , 个 案 研究 分 析 不 是 一 种 方法 [2 幻 尽 管 如 此 ， 
偏离 个 案 分 析 仍 可 用 于 揭示 为 何 个 案 是 偏离 的 ,并 指出 原先 设计 中 未 考虑 到 的 
额外 变量 。 如 果 这 么 运用 , 则 个 案 研究 便 具有 理论 上 的 价值 。 偏 离 个 案 弱 化 了 
原先 的 假设 ,但 研究 它们 可 以 帮助 修改 并 增强 原先 的 命题 。 
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比较 研究 方法 是 社会 科学 依然 在 寻找 “通用 语言 ”的 时 期 发 展 起 来 的 。 即 
理论 的 和 操作 的 概念 , 可 不 受 本 质 的 ,时间 的 或 空间 的 限制 而 被 运用 。 这 一 过 
程 与 客观 的 “N” 的 扩展 同时 发 生 , 这 种 扩展 由 于 后 殖民 地 区 的 民主 化 进程 .研究 
者 主观 兴趣 的 增加 以 及 新 兴国 家 数据 被 大 量 收集 而 产生 。 这 一 步 暗示 着 “用 变 
量 来 取代 合适 的 名 字 ”(Przeworski & Teune，1970) 定 义 那 些 能 够 “旅行 ”的 概 
念 (Sartori，1970) ,并 将 “普遍 集合 ”应 用 于 所 有 社会 系统 (Almond, 1966; Lass- 
well，1968) 。 另 外 , 因 个 案 数量 过 少 而 研究 问题 过 多 ,这 也 涉及 对 变量 的 简洁 
运用 ,并 导致 了 “强烈 反对 ……“ 构 型 的 ?或 “情境 的 ?分析 ”(Lijphart，1971; 
690) , 因 其 不 能 生成 一 般 化 的 陈述 。 

社会 科学 中 关于 比较 方法 的 早期 著作 强烈 反对 “ 构 型 的 ”或 “组 合 的 ”分 析 ， 
其 中 列 出 了 一 大 堆 潜 在 解释 变量 (Braibanti, 1968; 49; Przeworski & Teune, 
1970) 。 这 与 当今 发 展 复杂 的 、 构 型 性 、 组 合 性 方法 的 趋势 相悖 。30 年 后 ,社会 
科学 方法 的 争论 ,很 大 一 部 分 关注 另 一 个 方向 的 “反应 ”, 即 从 “变量 取向 ”方法 
回 摆 到 “个 案 取 向 ”和 整体 方法 ,后 者 可 在 更 “深入 ”的 中 层 情境 下 对 属性 进行 分 
析 。 正 如 戈 德 索 普 指出 的 ,这 代表 了 整体 主义 的 复活 ,这 与 普 沃 斯 基 和 特 恩 提 
出 的 强调 用 变量 取代 “特定 名 字 ” 的 工作 背道而驰 (Przeworski & Teune, 
1970)。 另 外 ,如 果 有 研究 者 关注 “整个 个案 ,那么 ,他 依然 指向 个 案 一 系列 的 特 
性 或 者 属性 。 只 有 当 我 们 比较 个 案 取 值 或 共享 属性 时 , 比较 才 可 能 进行 , 即 比 
较 的 是 变量 (Bartolini，1993: 137; Goldthorpe,，2000)。 用 “变量 ”这 一 术语 进 
行 思 考 而 不 再 限定 于 “变量 取向 ”的 方法 中 ,成 为 变量 和 个 案 取 向 方法 的 共同 
特点 。 
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读者 应 当 认 识 到 ,社会 科学 中 这 一 争论 不 是 最 近 才 发 生 , 而 是 20 世纪 60 年 
代 以 来 ,“ 比 较 方法 ”在 社会 科学 各 分 支 领 域 得 到 迅速 发 展 后 一 直 存 在 的 ,尤其 
是 在 人 类 学 、 社 会 学 和 政治 学 (比较 政治 学 ) 领 域 。 因 此 ,读者 现在 应 当 清 楚 , 尽 
管 有 时 这 些 争论 很 激烈 ,但 两 种 方法 之 间 存 在 着 逻辑 本 质 和 方法 论 的 共同 性 ， 
即 大 样本 设计 和 统计 方法 、 小 样本 设计 和 布尔 逻辑 方法 。 

本 书 试图 强调 这 些 共同 点 。 两 个 方法 最 终 都 是 变量 取向 的 (尽管 有 些 个 案 
分 析 是 “ 深 ” 的 ,而 不 属于 变量 取向 ) ,都 可 处 理 构 型 性 和 组 合 性 的 因果 性 ,同时 
还 能 处 理 和 至 加 性 的 因果 关系 ;两 种 方法 都 建立 不 同类 型 的 变量 模型 一 一 离散 的 
和 连续 的 以 及 定 类 的 、 定 序 的 和 定 距 的 ;两 种 方法 都 尝试 建立 概率 性 的 而 非 决 
定性 的 因果 性 评估 。 每 种 方法 都 有 其 独特 的 优势 和 弱点 ,但 其 共同 点 或 比 差异 
更 多 。 或 许 对 不 同方 法 进行 更 系统 和 深入 的 比较 ,会 揭示 更 多 更 根本 的 潜在 共 
同性 。 

本 书 的 目的 是 展示 ,在 所 有 控制 变异 的 社会 科学 方法 中 ,存在 许多 比较 原 
则 一 一 实验 法 统计 变量 取向 的 方法 以 及 小 样本 个 案 取向 的 比较 方法 一 一 从 而 
作出 了 超越 不 同方 法 的 科学 尝试 。 因 此 ,比较 被 认为 是 一 个 所 有 方法 共有 本 质 
的 根本 逻辑 原则 , 它 使 我 们 可 以 积累 研究 成 果 , 收 集 、 编 码 数 据 ,并 得 出 更 一 般 
化 的 结果 。 
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注释 





[1] “定性 的 ”这 一 术语 在 这 里 指 的 是 离散 的 、 二 分 的 、 定 类 的 或 者 定 序 的 测量 层级 。 这 一 术语 并 不 指 
代 质 性 方法 ,比如 ,民族 志 、 访 谈 分 析 、 日 记 的 内 容 分 析 、 生 活 史 ,话语 或 基于 影像 与 档案 的 研究 方 
法 ,情境 分 析 、 参 与 观察 以 及 自我 观察 。 在 此 意义 上 (定性 特 指 二 分 、 定 类 变量 的 测量 ) ,我 们 才 可 
认为 , “定性 比较 方法 ”的 内 在 人 逻辑 事实 上 与 定量 逻辑 一 致 , 即 它 是 一 种 基于 控制 变异 来 检验 自 变 
量 和 因 变 量 之 间 因 果 关 系 的 实证 方法 。 

[2] (实验 ) 操 控 同 时 关注 实验 变量 (可 操纵 变量 或 内 部 变量 , 即 研究 者 希望 检验 其 作用 的 变量 ) 与 控 

制 变量 (外 部 变量 ) 。 研 究 者 控制 控制 变量 ,是 为 了 把 它们 的 影响 排除 掉 。 

[ 3 ] 求 同 求 异 并 用 法 亦 被 称 为 “间接 差异 法 ”。 本 书 使 用 “ 求 同 求 蜡 并 用 法 ”, 与 密 尔 的 用 法 保持 一 致 。 

[4] 比较 法 并 非 如 其 宣称 的 ,是 唯一 基于 逻辑 的 方法 ,因此 ,不 可 能 维持 比较 法 “基于 逻辑 方法 ”的 独 

特地 位 (Ragin，1987: 15)。 统 计 法 同样 基于 逻辑 准则 。 

[5 ] 密 尔 提 出 ,“ 共 存 本 身 必须 被 求 异 法 证 明 ”(Mill, 1875; 465)。 

[6 ] 研究 者 希望 通过 控制 某 些 因素 来 排除 其 对 实验 性 自 变量 和 因 变 量 关系 产生 的 影响 。 当 然 , 研 究 

者 基于 既 有 知识 、 洞 见 和 运气 来 决定 哪些 因素 相关 ,从 而 应 该 被 控制 。 

[7 ] 在 这 一 时 期 ,有 大 量 关 于 比较 法 的 著作 是 从 人 类 学 领域 引进 的 (Eggan，1954; Radcliffe-Brown, 

1951, 1958; Sjoberg, 1955)。 ` 

[ 8 ] 参见 Andersen(2007), Berry & Feldman(1985), Bray & Maxwell(1985), Breen(1996), Dunte- 
man & Ho(2005), Fox(2000a, 2000b) Ail Lewis-Beck(1980、1995) 的 研究 。 

[9 ] 当 我 们 谈 及 个 案 的 数量 而 非 它们 的 大 小 时 ,有 些 学 者 偏向 于 谈论 “少数 样本 ?而 非 “ 小 样本 ”。 博 
伦 、 恩 特 威 斯 尔 和 奥 尔 德 森 在 QCA 和 其 他 软件 开发 之 前 就 已 经 表明 这 点 ,大 部 分 比较 研究 都 是 
基于 少数 个 案 的 (Bollen, Entwisle & Alderson, 1983: 327 一 328) 。 

[10] 跨 系 统 扩散 不 应 与 下 面 这 些 混淆 :(1) 渐 进 主义 或 者 某 既 定 变量 的 变动 ,依赖 于 同一 个 变量 先前 
的 变动 ;(2) 全 球 力量 (全 球 性 条 件 随时 间 的 变化 而 影响 所 有 个 案 )。 

[11] Df=(N—V)—1, Df 是 自由 度 ,NN 代表 个 案 数 量 ,而 V 是 自 变 量 ( 解 释 变 量 ) 数 量 。 所 以 , 当 有 两 
个 个 案 , 一 个 自 变 量 时 , Df = 0, 就 是 任何 基于 这 种 分 析 的 因果 关系 都 是 无 效 的 (Campbell， 
1975). 

[12] 金 . 基 奥 恩 和 韦 尔 巴 也 建议 增加 观察 值 的 数量 (King，Keohane & Verba, 1994)。 如 上 所 述 ,这 
FPAR PEIN A R. 

[13] 相 比 “概念 ”, 我 们 更 倾向 于 使 用 “类 别 ” 这 一 术语 。 因 为 它 直 接 指向 分 类 问题 ,指向 一 个 概念 的 边 
界 (Collier & Mahon, 1993; 853) 。 

[14] 等 价 问题 引 来 怀疑 论 的 建构 主义 者 的 极端 批评 。 他 们 质疑 ,是 否 可 能 存在 能 形成 “ 跨 文 化 .规律 
似 的 因果 概括 ”的 比较 政治 科学 (MacIntyre，1972: 9)。 这 一 批评 基于 密 尔 给 出 的 警告 , 即 在 社 
会 世界 中 去 假定 相似 性 要 小 心 , 因 为 很 多 时 候 相 似 性 是 表面 的 .具有 误导 性 的 。 有 学 者 举 了 这 些 
例子 ,比如 ,阿尔 蒙 德 和 韦 尔 巴 指出 , “自尊 心 ”概念 在 英国 和 意大利 具有 不 同 的 含义 , “政治 党 派 ” 
在 非洲 和 西方 世界 也 指向 不 同类 型 的 组 织 形式 (Almond & Verba, 1963), 

[15] 除了 这 些 基本 规则 ,分 类 法 还 必须 具有 一 定 的 稳定 性 , 即 它们 不 能 总 是 频繁 变动 ,尤其 是 在 使 用 
纵 贯 数据 时 ;分 类 还 必须 是 平衡 的 ,不 能 在 某 一 类 中 有 太 多 个 案 , 且 每 一 类 别 包 含 的 个 案 数量 应 

[16] 这 些 备 择 的 分 类 方法 基于 集合 理论 。 第 三 种 针对 经 典 分 类 问题 的 备 择 方法 同样 基于 集合 理论 ， 





基于 布尔 代数 的 比较 法 导论 | 


即 “ 模 糊 集 合 ”, 这些 一 定 程度 上 都 基于 并 正式 化 了 其 他 的 模糊 分 类 方法 。 这 一 问题 会 在 下 文 进 
一 步 讨论 。 

[17] 如 戴 穆 尔 和 伯 格 - 施 洛 瑟 指 出 的 ,差异 最 小 设计 方法 关注 相似 个 案 之 间 自 变量 的 属性 (而 因 变 量 
的 取 值 是 不 同 的 ) (De Meur & Berg-Schlosser, 1994)。 正 因 如 此 ,他 们 讨论 了 异 果 差 异 最 小 设计 
(MS-DO) 。 参 见 下 文 的 讨论 。 

[18] REH CHAE 而 不 是 p 和 9 来 取代 经 验 属性 或 性 质 的 简单 陈述 。 

[19] 这 一 否定 式 或 消除 性 的 确认 方法 ,在 剩余 法 (第 四 原则 ) 那 里 表达 得 更 为 清楚 ,表达 如 下 :“ 从 一 现 
象 中 减 去 那些 在 先前 归纳 中 已 知 是 某 些 前 件 之 结果 的 部 分 ,那么 ,现象 剩 下 的 部 分 就 是 剩余 前 件 
的 结果 。”(IMill,，1875: 460) 这 很 明显 是 排除 法 ,适用 于 所 有 的 方法 。 然 而 ,根据 涂 尔 干 的 观点 ， 
这 一 方法 在 社会 科学 中 并 无 特别 的 作用 ,因为 社会 现象 过 于 复杂 ,不 可 能 排除 一 个 原因 之 外 的 所 
有 其 他 因素 。 

[20] 包含 性 分 离 式 指 的 是 , “无论 何 时 ”, 只 需 有 任何 一 个 为 “ 真 ”, 那 么 联合 陈述 就 为 真 ( 灯 不 亮 ,是 因 
为 “要 么 开关 关 着 ,要 么 灯泡 烧 掉 了 ”)。 而 一 个 排除 性 分 离 式 是 要么 …… 要 么 ”, 但 两 者 不 能 同 
时 出 现 , 这 可 以 表示 为 (CI 十 Cz)。 一 (CI。C2)。 





[21] 和 否定 式 真 值 表 如 下 : 
C ~C 
1 0 
0 1 


[22] 软件 和 手册 可 以 在 网 上 下 载 。 其 他 软件 程序 ,如 TOSMANA( 小 样本 分 析 工具 ) ,由 Lasse Cron- 
qvist 开发 , 见 www. tosmana. org. 

[23] 正 因为 这 样 ,许多 作者 偏向 于 使 用 确证 而 非 证 明 , 用 弱化 而 非 证 伪 或 拒绝 。 

[24] “个 案 研究 在 解释 方面 没有 用 处 …… 比 如 ,我 们 不 能 用 美国 家 庭 的 研究 得 出 结论 说 ,工业 化 导致 
大 量 孤 立 的 核心 家 庭 。 城 市 化 ,边疆 地 区 或 者 清教徒 传统 ,同样 可 以 导致 这 种 结果 。”(Zelditch， 
1971: 288 一 289) 
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对 人 类 来 说 ,集合 概念 的 得 来 相当 容易 。 人 们 可 能 发 现 ,集合 的 逻辑 最 早 来 自 亚 里 
士 多 德 ,他 在 他 经 典 的 《逻辑 学 》 里 认为 ,人 与 牛 都 是 “动物 ”并且 把 动物 分 为 有 足 的 、 双 
足 的 ,有 起 的 与 水 生 的 几 种 不 同类 别 。 直 到 1874 年 ,这 种 逻辑 观念 才 得 到 精确 的 数学 表 
述 。 乔 治 + 肯特 尔 (Georg Canter) ,这 位 双亲 来 自 俄罗斯 的 丹麦 学 者 ,发 表 了 一 篇 有 数学 
公式 与 严谨 的 集合 概念 的 论文 ,标志 了 集合 理论 作为 一 个 数学 分 支 的 诞生 。 

集合 理论 ,或 本 书 中 称 为 “经 典 集合 论 "的 学 说 ,长 期 以 来 支配 着 数学 教学 ,现在 仍然 
是 高 中 数学 教材 里 的 重要 组 成 部 分 。 根 据 这 个 理论 ,成 分 函数 ,或 以 mx 来 表示 任何 属 
FX 集合 的 数据 ,只 有 两 种 数值 , 即 0 或 1, 而 且 其 函数 图 形 可 以 表示 为 mx: X->{0, 1}。 
然而 ,这 个 对 现实 的 简化 被 罗 飞 . 查 迪 (Lotfi Zadeh) F 1965 年 所 发 表 那 篇 关于 模糊 集合 
的 革命 性 论文 永远 改写 了 。 模 糊 集合 的 函数 图 形 可 以 定义 为 mx: X 一 [0, 1], 这 人 允许 数 
值 出 现在 整个 单位 区 间 内 。 尽 管 模糊 集合 的 逻辑 基础 可 以 追溯 到 柏拉图 ,但 是 直到 查 迪 
论文 的 出 现 , 才 奠 定 了 这 类 理论 研究 的 基础 ,该 理论 随后 被 应 用 在 计算 机 科学 、 工 程 科学 
与 其 他 基础 科学 ,包括 社会 科学 之 中 。 时 至 今日 ,模糊 逻辑 的 运用 已 经 涉及 如 何 推动 子 
弹 列 车 ,洗衣 机 与 摄影 机 的 运行 等 各 方面 。 

模糊 集合 理论 对 社会 科学 有 何 贡献 呢 ? 在 社会 科学 研究 里 ,模糊 性 是 稀 松平 常 的 事 
情 ,模糊 集合 理论 为 我 们 提供 了 一 种 适当 的 方式 去 系统 性 、 建 设 性 地 处 理 模糊 性 。 史 密 
生 与 弗 桂 能 的 模糊 集合 理论 是 该 领域 的 及 时 雨 。 本 书 提供 了 模糊 集合 理论 的 介绍 , 它 超 
越 了 我 们 熟悉 的 清晰 二 分 逻辑 领域 ,是 带领 读者 前 往 应 许 之 地 的 一 趟 智 识 之 旅 。 
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社会 科学 研究 者 长 期 以 来 观察 到 ,尽管 人 类 习惯 于 把 他 们 的 世界 分 成 几 个 
领域 或 类 型 ,但 他 们 却 常 使 用 一 些 边界 模糊 或 是 成 分 渐变 的 分 类 。 社 会 科学 界 
所 使 用 的 概念 也 常常 如 此 。 本 书 介绍 模糊 集合 理论 , 它 是 罗 飞 ， 查 迪 对 经 典 集 
合理 论 的 延伸 ,为 处 理 允 许 部 分 成 员 归 属 ( 有 时 译 为 元 素 ) 或 归属 程度 不 一 的 分 
类 方式 ,提供 了 一 个 数学 框架 。 

在 最 初 允许 样本 部 分 地 属于 一 个 集合 的 直觉 显现 之 后 ,模糊 集合 理论 提出 
了 并 集 与 交集 等 集合 概念 的 一 般 化 理论 。 因 此 ,这 个 理论 把 分 类 概念 带 到 了 向 
量 的 领域 。 如 果 经 济贫 困 与 心理 忧郁 的 程度 被 认为 是 重要 的 ,那么 模糊 集合 理 
论 认为 ,我 们 讨论 穷人 与 忧郁 人 群 交集 的 程度 有 多 高 之 类 的 议题 仍 有 意义 。 我 
们 把 模糊 集合 理论 加 入 社会 科学 的 工具 箱 有 5 大 理由 : 


第 一 ,该 理论 能 够 系统 化 地 处 理 模糊 性 。 

第 二 ,社会 科学 的 许多 创见 同时 具备 分 类 与 向 量 的 性 质 ,即便 是 分 类 
概念 ,也 有 重大 的 程度 之 分 。 

第 三 ,该 理论 可 以 超越 条 件 分 析 的 工具 与 一 般 线 性 模型 ,用 集合 理论 
的 一 般 化 操作 来 分 析 多 变量 关系 。 

第 四 , 它 有 理论 上 的 精确 性 ,大 部 分 理论 常常 使 用 逻辑 或 集合 导向 的 
词汇 来 表达 ,但 多 数 以 连续 变量 为 主 的 统计 模型 则 不 是 。 

第 五 ,模糊 集合 理论 以 精确 的 方式 结合 了 集合 导向 的 思路 与 连续 
变量 。 
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在 过 去 的 40 年 间 ,模糊 集合 理论 被 引 介 以 来 ,已 经 累积 了 许多 合适 的 应 用 
经 验 , 这 种 情况 建议 我 们 适时 出 版 一 本 介绍 模糊 集合 的 书籍 。 举 例 来 说 ,在 心 
理学 界 , 出 现 了 以 模糊 集合 为 基础 的 认 知 理论 (例如 ,Oden & Massaro, 1978) 
或 记忆 理论 (Massaro，Weldon & Kitzis，1991) ,模糊 集合 被 用 来 解决 测量 问 
题 ,并 且 提 供 了 新 颖 的 分 析 工 具 (Hesketh, Pryor, Gleitzman & Hesketh, 
1988; Parasuraman, Masalonis & Hancock, 2000; Smithson, 1987; Wallsten, 
Budescu, Rappoport, Zwick & Forsyth, 1986; Zwick, Budescu & Wallsten, 
1988; Smithson & Oden，1999) 。 此 外 ,在 社会 学 界 与 政治 学 界 , 拉 津 呼吁 引进 
模糊 集合 来 处 理 他 所 谓 “ 多 样 性 导向 ”的 研究 ,并 且 强 化 理论 与 数据 分 析 的 关联 
性 (Ragin，2000) 。 

因此 ,本 书 旨 在 引导 社会 科学 研究 者 熟悉 模糊 集合 与 方法 工具 以 便 运用 
它 。 第 2 章 介绍 模糊 集合 理论 的 基本 概念 ,包括 成 员 归属 等 级 集合 的 理论 运 
算 ,模糊 数值 与 模糊 变量 。 第 3 章 着 重 在 模糊 集合 与 调查 方法 里 赋予 成 员 归 属 
等 级 以 建立 归属 函数 。 第 4 章 探讨 模糊 集合 的 单 变量 性 质 一 一 也 就 是 集合 的 量 
与 势 一 一 所 拥有 的 概率 分 布 及 模糊 性 。 第 5 章 发 展 了 集合 之 间 ( 交 集 、 并 集 与 相 
容 ) 的 双 变 量 关 系 。 最 后 ,第 6 章 引 进 多 集合 关系 与 概念 ,包括 组 合集 合 指针 、 条 
件 元 素 函 数 以 及 多 重 与 部 分 交集 与 兼容 。 纵 贯 全 书 ,我 们 从 不 同 的 社会 科学 学 
科 里 找 出 范例 ,并 且 尽 量 建立 起 模糊 集合 取向 与 传统 数据 分 析 技 巧 之 间 的 关 

与 其 他 模糊 集合 理论 的 教科 书 不 同 , 本 书 强 调 将 模糊 集合 的 概念 与 相当 直 
接 的 统计 技巧 (尤其 是 许多 已 经 用 在 标准 化 统计 软件 中 的 技巧 ) 结 合 起 来 。 我 
们 相信 ,这 种 结合 是 必要 的 。 当 模糊 集合 理论 被 引入 社会 科学 后 ,多 数 研究 者 
常常 仅仅 运用 模糊 集合 引入 成 员 归 属 等 级 与 重合 分 类 的 想法 , 某 些 明显 是 归属 
等 级 的 运用 也 许 混 合 了 原型 与 类 似 原 型 的 测量 ,少数 运用 模糊 交集 与 并 集 、 模 
糊 逻 辑 或 其 他 模糊 推论 方法 。 本 书 把 模糊 集合 理论 作为 主要 的 核心 议题 ,并 且 
为 那些 希望 驾驭 模糊 集合 概念 ,以 作出 统计 推论 并 检验 他 们 模型 的 研究 者 , 提 
供 明 确 的 指引 。 

有 关 模 糊 集合 的 某 些 观 点 并 不 包括 在 这 本 书 里 ,不 是 因为 我 们 认为 那些 方 
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向 不 重要 ,而 是 因为 讨论 它们 会 使 本 书 的 篇 幅 加 倍 。 反 之 ,我 们 将 集中 讨论 那 
些 对 广大 社会 科学 圈 内 的 、 曾 听 说 过 模糊 集合 理论 但 是 不 了 解 它 的 读者 们 而 
言 ,最 有 趣 也 最 容易 理解 的 观点 。 然 而 ,我 们 在 此 列举 一 些 没 包括 在 本 书 之 内 ， 
但 是 仍然 与 社会 科学 家 们 有 关 的 两 个 领域 里 的 研究 文献 。 模 糊 逻 辑 是 模糊 集 
合理 论 的 直接 延伸 ,并 且 包 含 在 许多 模糊 推论 与 控制 系统 的 运用 中 ,范围 从 简 
单 静 态 数 据 结构 到 复杂 动态 的 系统 分 析 。 贝 多 西 (Bardossy) 与 杜 克 斯 坦 
(Duckstein) 讨 论 了 区 域 规划 所 使 用 的 数据 系统 。 塞 斯 (Seitz) 与 他 的 同事 们 使 
用 动态 推论 系统 来 模拟 外 交 决 策 与 组 织 行为 (Seitz，1994; Seitz, Hulin & 
Hanisch, 2001)。 泰 伯 对 部 分 使 用 模糊 理性 的 计算 模型 提供 了 基本 简介 
CTaber，1992) 。 模 糊 数据 的 简化 技巧 最 初 由 模块 认 知 的 研究 引进 并 加 以 发 展 ， 
这 一 类 研究 很 多 都 属于 模糊 群 聚 方法 (Smithson，1987; Steenkamp & Wedel, 
1991) 。 另 一 个 研究 取向 的 例子 属于 潜在 阶级 分 析 的 “成 员 归 属 ? 延 伸 (Manton， 
Woodbury & Tolley, 1994) ,在 潜在 阶级 分 类 里 允许 部 分 成 员 归 属 的 存在 ,有 个 
叫 DSIGoM 的 统计 软件 运用 该 技术 并 发 行商 业 版 (Decision Systems Inc. , 
1998) ,如 今 ,GoM 模型 在 健康 研究 与 人 口 学 领域 已 被 大 量 运用 。 此 外 ,还 有 研 
究 者 用 多 层次 模型 来 扩展 模糊 集合 ,以 便 在 家 庭 组 成 变迁 的 过 程 中 估计 家 庭 数 
据 结构 (Goldstein，Rasbash，Browne，Woodhouse & Poulain, 2000) 。 


aio Riia a 


E 





在 这 一 章 中 ,我 们 将 提供 一 个 模糊 集合 数学 的 非 技 术 性 导论 ,我 们 不 着 重 
数学 推算 的 细节 而 尽 可 能 注重 概念 的 澄清 。 在 工程 学 的 教科 书 里 可 找到 不 少 
有 用 的 技术 性 导论 ,其 中 ,最 详尽 的 是 齐 默 尔 曼 (Zimmerman，1993)、 克 立 尔 与 
原 (Klir & Yuan,，1995) 的 著作 ,对 本 章 提 及 的 主题 细节 有 兴趣 的 读者 可 以 自行 
参考 。 模 糊 集合 理论 是 集合 理论 的 概 推 ,虽然 集合 理论 是 现代 数学 的 基础 ,而 
且 对 博弈 论 与 概率 论 熟悉 的 读者 应 该 都 已 经 有 所 了 解 ,但 我 们 也 不 能 假设 每 个 
读者 都 懂 , 因 此 ,我 们 将 从 集合 理论 的 简单 回顾 与 运算 开始 介绍 ,然后 把 模糊 集 
合 当成 标准 “清晰 ”的 集合 理论 的 特殊 延伸 。 虽 然 “ 模 糊 ” 一 词 经 常 有 负面 的 意 
思 , 但 模糊 集合 数学 其 实 是 很 精确 的 , 它 能 使 我 们 更 妥善 地 估计 那些 呈现 出 某 
种 程度 不 确定 性 与 模糊 性 的 现象 。 


集合 理论 


本 书 希望 合理 地 介绍 集合 理论 。 对 概率 论 、 实 数 分 析 \` 几 何 理论 .数理 统计 
与 线性 代数 的 介绍 都 得 包括 集合 理论 。 经 典 集合 理论 是 处 理事 物 之 加 总 以 及 
这 些 事物 彼此 关系 的 一 种 数学 运算 ,其 中 最 基本 的 是 集合 的 概念 , 它 是 一 组 事 
物 的 清单 ,例如 , A= {a, b, c, d, e) MA B= (橘子 ,柠檬 , 酸 橙 ,葡萄 柚 , 红 
柑 }。 集 合 的 有 趣 之 处 在 于 ,其 与 一 组 决定 相关 元 素 或 非 相关 元 素 的 规则 有 关 。 
例如 ,集合 A 可 以 被 视 为 以 “前 五 个 字母 ?为 规则 的 成 员 ,集合 B 可 以 被 视 为 “ 常 
见 的 柑橘 属 水 果 ” 这 个 规则 下 的 成 员 , 当然“ 常见 ”一 词 也 可 以 被 赋予 更 精确 的 
定义 。 显 然 , 当 以 集合 来 给 经 验 现实 建 模 或 是 测算 现实 数据 时 ,界定 事物 的 规 
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则 是 最 首要 的 应 该 被 厘清 的 问题 。 在 金 桔 与 柑橘 大 丰收 但 是 没 出 产 酸 橙 与 葡 
萄 柚 的 地 方 ,常见 的 柑橘 属 水 果 ? 就 难以 定义 集合 B。 

集合 有 4 种 最 基本 的 运算 方式 :并 集 ,交集 、 余 集 ( 补 集 ) 与 包含 ,通常 是 依 序 
用 下 列 符号 表示 :U.、 门 、~ 与 (虽然 有 少数 作者 有 时 使 用 不 同 的 符号 )。 用 这 
些 运 算 方 式 就 可 以 组 成 相当 复杂 的 集合 。 

并 集 与 交集 依据 特定 运算 程序 ,从 两 个 (或 以 上 ) 的 集合 中 创造 新 的 集合 ， 
是 重要 的 关系 公式 。 并 集 把 两 个 集合 接合 在 一 起 ,在 包含 的 意义 上 可 读 为 
“或 ”, 一 般 来 讲 就 是 “ 且 / 或 "。 用 前 面 说 到 的 两 个 集合 来 表示 , AU B= (a, 
b, c, d, e, 橘子 ,柠檬 , 酸 橙 ,葡萄 柚 , 红 柑 } 。 交 集 是 两 个 集合 重 至 之 处 ,可 以 
简单 读 成 “ 且 ”。 前 面 这 两 个 集合 因为 没有 相同 的 元 素 ,因此 其 交集 是 空 的 ， 
我 们 可 以 将 之 写成 A 门 B= 名, 后 面 这 符号 是 无 或 者 空 集合 ,集合 内 什么 也 
没有 。 

余 集 ,或 者 读 做 “ 非 ”, 也 称 做 “ 补 集 ”, 是 在 全 集 所 有 元 素 里 不 属于 原 集合 的 
部 分 ,其 定义 取决 于 我 们 如 何 界定 集合 外 的 全 部 事物 ,这 就 是 全 集 U。 如 果 没 有 
UU ,我们 不 可 能 找到 有 意义 的 补 集 ,也 就 不 可 能 对 集合 提出 任何 有 实质 意义 的 命 
题 。 假 设 对 前 面 定 义 的 集合 A 来 说 , U = {所 有 英语 字母 ), 则 ~ A = 
{f，g，…，z)。 此 时 ,应 注意 到 A U~A=U, 用 文字 表示 就 是 “所 有 的 A 与 所 
有 的 非 A 加 起 来 就 是 全 部 的 事物 ”。 此 外 , AQN~A= OS, 即 同时 包括 A 与 非 
A 的 集合 是 空 集 , 这 个 命题 又 叫做 “中 间 排 除 律 ”, 对 于 理解 模糊 集合 理论 有 重 
要 意义 ,因为 模糊 交集 并 不 遵守 中 间 排 除 律 。 

包含 关注 的 是 一 个 集合 是 否 与 男 一 集合 的 元 素 重合 。 若 集合 Q 包括 集合 
P. WERE P 内 的 所 有 元 素 丝 在 集合 Q 内 ,以 集合 A 与 集合 B 来 说 , 则 显然 没有 
任何 互相 包含 的 元 素 。 然 而 ,给 定 工 = (a, b, c …, j}, ACT 可 以 读 成 “A 被 
T HEAR RETURA”. WRITES 5 章 将 会 看 到 的 ,包含 的 不 对 称 性 特别 
有 利于 解释 那些 经 验 个 案 中 的 关系 ,其 中 ,许多 都 与 社会 科学 家 常用 的 相关 系 
数 不 同 。 包 含 与 交集 有 特殊 的 关系 , 当 PCR HN P N Q= P. 4 PRH 
QCP 时 , P =Q., 表 2.1 显示 了 集合 理论 的 运算 规律 。 
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表 2.1 最 重要 的 集合 理论 运算 规律 





运算 符号 标记 法 语言 翻译 
并 集 U AUB A 或 B 或 A AB 的 所 有 元 素 
交集 N ANB A HB 的 元 素 
补 集 ~ ~A 全 集 里 不 属于 A 的 元 素 
包含 = ACB Bae A 的 所 有 元 素 

为 何 要 研究 模糊 集合 ? 


假定 集合 V = (a, e, i, 0, u) 是 元 音 的 集合 ,逻辑 上 说 , C=~V, 也 就 是 
辅音 的 集合 ,因为 字母 不 属于 元 音 就 属于 辅音 。 然 而 我 们 知道 ,字母 y 有 时 是 
元 音 有 了 时 又 是 辅音 ,例如 在 “my” 这 个 词 里 y 就 是 元 音 ,但 是 在 “yours” 这 个 词 
里 却 不 是 。y 究竟 属于 集合 V 还 是 辅音 集合 C? 由 于 y 并 不 是 非 V 即 C, mE 
同时 属于 两 者 ,所 以 答案 不 清楚 。 当 然 ,这 表示 区 分 元 音 与 辅音 的 规则 并 不 
造成 互 斥 的 两 种 字母 分 类 , 当 我 们 定义 C 王 一 六 时 ,字母 y 已 经 违反 了 中 间 排 

虽然 这 个 例子 连 小 孩 也 很 熟悉 ,但 是 遇 上 日 常 的 数据 库 建 构 与 其 中 事物 关 
系 的 推论 过 程 时 ,我 们 就 很 难 想 清楚 更 复杂 的 问题 。 经 典 集合 理论 常常 难以 处 
理 集合 元 素 分 类 规则 的 不 确定 性 。 数 学 元 素 总 可 以 被 定义 清楚 ,经 验 数据 却 非 
如 此 。 

模糊 集合 正 是 被 设计 来 处 理 这 种 特殊 类 型 的 不 确定 性 。 我 们 常 称 其 为 “ 程 
度 一 模糊 性 ”, 这 种 状况 来 自 事物 具有 某 种 程度 不 一 的 特质 。 模 糊 性 最 容易 出 
现在 一 个 经 典 悖 论 中 , 即 我 们 接 下 来 介绍 的 连锁 推论 。 假 定 有 一 卡车 的 沙 , 当 
然 那 是 一 堆 沙 ,如 果 我 们 从 中 挑 出 一 粒 沙 , 仍 然 会 剩 下 一 整 堆 ,根据 这 种 暗藏 衣 
误 的 数学 归纳 法 ,我 们 即使 移 走 所 有 的 沙 粒 , 还 是 会 留 下 一 整 堆 沙 ,以 此 类 推 。 
然而 ,事实 上 ,我 们 拿 走 越 多 剩 下 就 越 少 ,就 不 会 有 人 说 剩 下 那 一 点 点 沙 还 是 一 
堆 。 因 此 ,问题 出 在 “一 堆 ? 的 定义 不 明确 。 这 就 是 模糊 性 的 主题 ,是 一 堆 或 不 
是 一 堆 , 两 者 之 间 没有 清晰 的 、 可 供 区 分 的 临界 点 。 
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社会 科学 里 的 许多 概念 都 包含 这 种 本 质 上 的 模糊 性 , 当 我 们 界定 一 些 典型 
案例 以 符合 概念 的 定义 时 ,在 不 同 集合 之 间 无 法 指出 清晰 的 界线 。 比 如 贫穷 ， 
在 一 个 固定 社会 脉络 里 ,如 “美国 中 西部 大 学 城 里 的 单身 人 士 ”, 我 们 可 以 相对 
容易 地 确定 贫穷 线 为 “2003 年 全 年 所 得 在 2 万 美元 以 下 ”。 经 典 集合 论 告诉 我 
们 ,一 个 中 西部 人 如 果 每 年 赚 了 超过 2 万 美元 ,就 非 穷 人 ,即使 大 家 都 认为 收入 
再 多 加 一 块 也 不 会 造成 那个 人 生活 上 的 任何 物质 影响 。 然 而 ,每 年 收入 再 加 上 
1 万 美元 可 能 就 会 使 其 脱离 贫穷 , 换 句 话说 ,在 年 收入 2 万 美元 与 3 万 美元 之 间 
可 以 消除 贫困 ,但 确切 的 数字 又 是 多 少 ? 模糊 集合 理论 为 我 们 提供 了 一 个 精确 
的 数学 工具 ,不 是 去 规定 一 个 清晰 的 临界 点 ,而 是 在 绝对 贫困 与 绝对 脱贫 的 数 
字 界 线 之 间 ,界定 成 员 归 属 的 不 同等 级 。 


归属 耳 数 


模糊 集合 的 基础 来 自 经 典 集合 ,但 是 增加 了 一 项 元 素 : 集 合成 员 某 种 特质 
的 可 数 成 分 ,范围 从 0 到 1。 正 式 地 说 ,归属 函数 ma 是 一 个 将 某 些 样本 空间 投 
影 在 单位 区 间 [0, 1j 之 间 的 函数 ,这 种 投影 可 以 表示 为 : 


ma(x):—>[0, 1] 


这 就 产生 了 模糊 集合 A。 谨 记 , 该 向 量 可 能 指 涉 一 个 全 集 ,但 也 可 以 被 定义 为 一 
个 数学 区 域 ,例如 ,一 条 实 线 或 者 代表 某 种 程度 范围 的 区 间 。 

归属 函数 是 一 个 "集群 ”的 指数 ,用 来 测量 茶 事物 z 作为 一 个 特定 集合 成 
员 归 属 的 等 级 。 与 概率 论 不 同 , 所 有 归属 等 级 加 起 来 不 用 等 于 1, 因 此 ,集合 
里 很 多 或 者 少数 事物 可 能 拥有 很 高 的 归属 值 。 然 而 ,集合 里 所 有 事物 的 归属 
值 与 其 补 集 加 起 来 仍然 必须 等 于 1。 经 典 集合 论 与 模糊 集合 论 的 差异 在 于 ， 
后 者 可 以 接受 部 分 的 归属 等 级 。 经 典 或 清晰 集合 事实 上 是 将 模糊 集合 的 归属 
值 限制 在 {0, 1) ,也 就 是 单位 区 间 的 两 端 。 模 糊 集 合理 论 用 归属 函数 赋予 每 
个 事物 某 个 比重 的 数值 来 模拟 模糊 现象 ,并 且 测 量 “ 这 个 事物 属于 集合 A” 属 
实 的 程度 。 
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表 2.2 常见 的 柑橘 属 水 果 


水 OR 水 果 





OE 1. 00 红 At 0. 50 
Fr E 1. 00 4 t 0. 00 
葡萄 柚 0.75 AOR 0. 25 








我 们 用 两 个 简单 的 例子 来 说 明 一 些 重点 。 首 先 ,我 们 主观 建构 一 个 “常见 
的 柑橘 属 水 果 ” 的 元 素 价值 ,从 {0，0. 25, 0.50, 0.75, 1} 中 选取 一 个 数 。 我 们 
赋予 的 数值 展现 在 表 2. 2 中 。 元 素 或 成 员 比 例 的 赋予 是 需要 审慎 思考 的 艰难 工 
作 , 我 们 会 在 第 3 章 详细 讨论 这 个 问题 ,然而 ,这 个 程序 与 许多 社会 科学 家 在 未 
考虑 模糊 集合 理论 的 情况 下 对 事物 进行 的 记录 与 分 类 工作 其 实 没 有 什么 不 同 。 

一 种 有 用 的 对 成 员 清单 一 般 化 的 记录 方式 ,是 将 标准 集合 配对 记载 下 来 : 
{( 脐 橙 , 1) , (柠檬 ,1),( 葡 萄 柚 ,0. 75), RE 0. 75),( 红 柑 ,0. 5), (金村 ,0),( 柑 
橘 ,0. 25) } 。 对 相对 小 规模 的 集合 来 说 ,这 种 等 级 配对 清单 的 记录 方法 很 完整 而 
且 很 有 用 。 

第 二 个 案例 展现 以 数学 区 域 处 理 成 员 归属 时 的 规则 。 通 常 ,这 种 成 员 界 定 
是 以 量化 方式 来 定义 的 区 域 。 以 前 面 贫穷 的 例子 来 说 ,我 们 可 以 用 年 收入 的 线 
性 过 滤 法 。 根 据 前 文 的 定义 ,年 收入 超越 3 万 美元 的 成 员 , 其 穷人 的 定义 为 0 
GEFA) ,从 3 万 美元 到 2 万 美元 是 线性 递增 的 比例 ,而 2 万 美元 以 下 的 定义 就 
是 1( 穷 人 )。 


0 (x > 30000) 


30000 — x 


Poor (x) = 4 35000 — 20000 


(20000 < x < 30000) 
1 (0 < x < 20000) 
这 看 起 来 很 容易 。 然 而 ,在 建构 模糊 集合 (或 任何 集合 ) 的 过 程 中 ,我 们 马 
上 会 遇 到 一 个 两 难 问题 , 那 就 是 全 集 U 的 定义 。 敏 锐 的 读者 或 许 已 经 察觉 ， 
前 面 的 水 果 集 合 已 经 包括 两 个 不 同 的 性 质 “ 常 见 的 ”与 “柑橘 属 水 果 ”( 这 当 
然 是 故意 的 ) 。 这 样 怎么 界定 全 集 呢 ? 这 是 柑橘 属 里 的 一 个 特定 种 类 ,是 一 
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般 的 水 果 , 或 是 杂货 店 里 买 得 到 的 ,还 是 什么 别 的 ? 对 不 同 的 全 集 来 说 , 成员 
归属 数值 将 会 有 不 同 的 意义 。 在 U = {柑橘 属 水 果 } 的 例子 里 , 金 桔 的 数值 0 
代表 这 种 水 果 很 少见 ,即使 它 确实 是 柑橘 属 的 水 果 。 然 而 ,假若 U = (一 般 的 
KR, 则 大 部 分 非 柑橘 类 的 水 果 都 会 被 赋予 0 的 数值 。 苹 果 当 然 很 常见 ,但 
不 是 柑橘 属 水 果 , 因 此 完全 不 属于 A 集合 成 员 。 就 连 这 种 看 起 来 有 点 可 笑 的 集 
合 ,事实 上 都 是 很 复杂 的 。 我 们 在 此 应 提醒 读者 , 当 建 构 一 个 总 体 时 ,清晰 是 最 
重要 的 特质 。 


模糊 集合 理论 的 运算 


与 经 典 集合 理论 类 似 , 模 糊 集 合理 论 包 括 并 集 、 交 集 、 补 集 与 包含 等 基本 运 
算 , 但 它 也 包括 非 经 典 的 运算 方式 ,例如 ,修正 值 的 集中 与 扩散 以 及 相连 的 模糊 
加 总 。 在 这 一 节 中 ,所 有 的 计算 公式 都 是 依据 只 有 两 个 集合 的 假设 所 设计 的 ， 
但 是 根据 数学 归纳 法 ,这 些 公 式 可 以 轻易 推导 到 3 个 以 上 集合 的 运算 。 为 了 呈 
现 模糊 运算 的 方式 ,我 们 扩展 了 水 果 的 例子 。 我 们 在 水 果 全 集 里 建构 了 4 个 模 
糊 集 合 ,这 不 是 一 份 完整 的 水 果 清 单 。“ 常 见 的 ”代表 对 美国 超级 市 场 上 可 获得 
水 果 的 一 种 主观 评判 。 “柑橘 属 ” 或 “ 茧 扒 科 ” 表 示 该 水 果 属 于 植物 学 上 的 某 一 
类 。 最 后 ，“ 酸 的 ”代表 主观 认定 酸 的 程度 。 柑 橘 属 与 蔷薇 科 是 清晰 集合 ,因此 ， 
其 所 有 成 员 的 数值 非 0 即 1( 见 表 2. 3) 。 

模糊 并 集 里 的 成 员 定义 是 集合 里 最 大 程度 的 成 员 归 属 。 并 集 X UY 的 成 
员 归 属 可 以 写成 : 


mxUY = max(mx, my) 


因此 ,脐橙 的 成 员 归 属 在 并 集 “ 常 见 的 局 柑橘 属 " 里 的 值 就 是 max(1. 00, 
1. 00) =1. 00, 而 其 数值 在 并 集 “ 赣 薇 科 凯 酸 的 ? 则 是 max(0. 00, 0.25) = 0. 25, 
模糊 交集 里 的 成 员 归 属 则 是 集合 里 最 小 程度 的 成 员 归 属 , 也 就 是 : 


mxNY = min(mx, my) 


因此 , 脐 杰 的 成 员 归属 在 “常见 的 站 酸 的 ”的 水 果 中 就 是 min(1. 00, 0.25) = 
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0. 25。 模糊 补 集 定 义 为 m~x = 1 一 mx , AL, PRE CEE MRE YS HA J 
属 为 1 一 0.25 = 0.75, 


表 2.3 两 种 延伸 集合 里 的 成 员 归 属 (以 水 果 为 例 ) 








水 R ROL A HAR 酸 的 ARR UR 常见 的 门 酸 的 
脐 1.00 1. 00 0. 00 0. 25 1. 00 0. 25 
ke 檬 1.00 1. 00 0. 00 1. 00 1. 00 1. 00 
葡萄 柚 0.75 1. 00 0. 00 0.75 1. 00 0.75 
R RH 0.75 1. 00 0. 00 0.75 1. 00 0.75 
红 W 0.50 1. 00 0. 00 0. 25 1. 00 0. 25 
金 tf 0.00 1. 00 0. 00 0. 00 1. 00 0. 00 
Ht #§ 0.25 1. 00 0. 00 0. 00 1. 00 0. 00 
3 果 1.00 0. 00 1. 00 0. 00 1. 00 0. 00 
杨 bk 0.00 0. 00 0. 00 0. 25 0. 00 0. 00 
F # 1.00 0. 00 0. 00 0. 00 0. 00 0. 00 
SRE 0.75 0. 00 1. 00 0.75 1. 00 0.75 
RE BE 0.25 0. 00 1. 00 0. 25 1. 00 0. 25 
wR 0.75 0. 00 1. 00 0. 00 1. 00 0. 00 
hk 子 0.50 0. 00 0. 00 0. 00 0. 00 0. 00 
菠 B 0.50 0. 00 0. 00 0. 50 0. 00 0. 50 
绿 葡 萄 1.00 0. 00 0. 00 0. 50 0. 00 0. 50 


除非 另 有 注 明 ,否则 接 下 来 本 书 的 模糊 并 集 与 模糊 交集 都 依 序 使 用 上 述 极 
大 与 极 小 运算 公式 。 然 而 ,我 们 必须 记 住 ,这 不 是 模糊 集合 理论 对 并 集 或 交集 
的 唯一 定义 。 史 密生 曾 延 伸 讨论 过 这 个 议题 ,虽然 其 他 参考 书籍 也 曾 在 思考 t 
规律 与 co 规律 时 提供 了 很 有 用 的 讨论 ,但 在 某 些 脉络 下 ,针对 某 些 特别 应 用 
的 需求 , 对 运算 公式 的 特殊 定义 可 能 更 适当 。 例 如 ,乘积 的 运算 公式 为 
mxuy =mx 十 my 一 mxy 与 mxNY = mxmy , 这 些 公式 事实 上 与 联合 独立 事件 
的 概率 论 有 相同 的 规则 。 它 们 与 极 大 一 极 小 运算 公式 的 不 同 之 处 在 于 ,这 些 公 
式 是 连续 性 的 ,因此 ,成 员 归 属 值 的 变化 总 是 能 反映 在 并 集 与 交集 的 成 员 上 , 连 
续 性 的 变化 或 许 能 更 有 效 地 反映 在 潜在 的 概念 空间 里 。 对 极 大 一 极 小 运算 方 
式 来 说 ,情况 未 必 如 此 。 

除了 不 连续 性 之 外 , 极 大 一 极 小 运算 公式 仍然 是 “产业 标准 ”。 它 们 运算 容 
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易 , 在 某 些 情况 下 占 优势 。 其 中 最 重要 的 或 许 是 ,这 些 运 算 对 输入 成 员 归 属 值 
时 所 产生 的 干扰 较 具 抵抗 性 一 一 这 些 干扰 通常 来 自 测量 误差 或 者 实际 的 变 
化 一 一 因此 只 能 给 予 等 级 式 的 测量 。 运 算 方式 的 多 元 化 是 模糊 集合 理论 的 优 
势 也 是 弱点 。 在 优势 方面 ,许多 不 同 的 运算 公式 提供 不 同 概念 建 模 的 工具 ;在 
弱点 方面 ,许多 选择 使 得 我 们 难以 分 辨 何者 是 最 适当 的 方案 。 当 然 , 这 些 运算 
公式 都 可 以 简化 到 经 典 集合 理论 ,也 就 是 只 有 0 与 1 两 极 的 元 素 。 

这 个 理论 使 我 们 得 以 将 运算 公式 组 合 起 来 ,从 而 创造 出 相当 复杂 的 集合 。 
事实 上 , 正 是 由 于 将 许多 简单 的 运算 公式 与 规则 建构 串 连 成 许多 有 趣 的 集 
合 ,模糊 集合 理论 才 有 其 长 处 。 脐 橙 的 成 员 等 级 在 “一 常见 的 门 酸 的 ”一 类 是 
min(1 一 1. 00, 0.25) = 0。 确 实 , 既 然 脐橙 是 甜 而 常见 水 果 的 典型 ,那么 在 上 述 
集合 里 的 成 员 等 级 很 低 也 很 合理 。 

模糊 包含 就 更 复杂 一 些 。 我 们 在 此 先 介 绍 经 典 包含 比率 (CIR), 在 第 5 章 
会 更 完整 地 讨论 。 对 清晰 集合 来 说 ,包含 是 有 或 没有 的 议题 ,集合 A 或 被 集合 
B 所 包含 ,或 没有 ,也 就 是 说 ,至 少 有 一 个 集合 A 的 元 素 不 在 集合 B 中 ,所 以 不 
算 包含 。 这 完全 没有 模糊 之 处 ,因此 从 数据 分 析 的 角度 来 看 是 不 合理 的 ,我 们 
总 是 预期 在 整体 趋势 之 外 会 有 一 些 随机 产生 的 误差 。 由 于 清晰 集合 算是 模糊 
集合 的 特殊 类 型 ,其 中 没有 任何 成 员 数 值 出 现在 单位 区 间 之 内 ,所 以 这 也 是 一 
种 归属 函数 。 所 以 ,包含 可 以 被 改写 成 对 成 员 归 属 的 命题 : 当 B 包含 A 时 ,集合 
A 内 的 事物 所 具有 的 成 员 值 不 能 超过 集合 B 内 的 事物 。 这 可 以 被 轻易 地 延伸 
到 连续 的 成 员 值 。 因 此 ,CIR 就 计算 了 这 类 事物 在 所 有 集合 内 事物 的 比率 。 如 
RHA n 件 事物 : 

CIRAcB = # (ma <mp)/n [2.1] 


由 于 这 是 个 比例 ,所 以 就 可 以 运用 有 关上 比例 的 标准 统计 方法 来 建构 CIR 的 统 
计 检 验 基 础 ,这 也 是 CIR 运算 的 重点 之 一 。B 包含 A 的 另 一 个 用 处 在 于 估计 
ma 与 ManB 有 多 相似 ,这 可 以 简单 地 用 mans 与 xzA 重合 的 点 来 解 。 如 果 两 者 
重合 , 那么 应 该 会 形成 一 条 截 距 为 PEW 1 的 直线 。 以 水 果 为 例 ， 
CTR 酸 的 C 常 见 的 = 15/16 = 0. 9375, 这 指出 , 酸 的 被 模糊 包含 在 常见 的 水 果 里 。 
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FETS eH EA E P ERE. MUREA H, CA 0. 75 的 酸性 也 有 
0. 25 一 酸性 的 成 员 归 属 , 则 其 “" 酸 的 站 一 酸 的 ?的 成 员 值 是 min(0. 75, 0, 25) = 
0. 25。 当 我 们 考虑 模糊 性 情况 时 ,这 貌似 合理 ,但 是 从 基因 工程 学 的 立场 来 看 ， 
一 种 植物 不 可 能 是 柑橘 属 又 不 是 柑橘 属 ,也 就 是 说 , 酸 橙 在 “柑橘 属 上 且 非 柑 桶 
属 ” 下 的 成 员 值 是 min, 0) = 0, 这 是 理所当然 的 。 

我 们 曾 提 到 对 模糊 集合 来 说 很 重要 的 3 种 运算 方式 :集中 、 扩 散 以 及 加 总 。 
因为 这 些 运 算 都 只 适用 于 0 与 1 之 间 模 糊 的 成 员 归 属 , 它 们 并 没有 运用 于 经 典 
集合 。 集 中 与 扩散 和 补 集 类 似 ,是 对 单一 集合 的 修正 ,加 总 则 与 并 集 或 交集 类 
似 , 处 理 多 集合 的 连结 。 集 中 与 扩散 是 对 成 员 归 属 的 修正 , 当 X 是 被 定义 的 成 
员 特 质 时 , 查 迪 建议 ,集中 与 “很 X”, 而 扩散 则 与 “有 点 X” 的 说 法 类 似 。 原 版 的 
集中 运算 公式 是 ma = m, 而 扩散 运算 公式 则 是 mp. = m3。 可 以 把 上 述 公 
一 般 化 为 :集中 就 是 乘 寡 大 于 1 .扩散 就 是 乘 寡 小 于 1 大 于 0。 

这 些 公式 的 灵感 来 自 单 位 区 间 内 可 用 乘 震 转 换 的 特质 。 乘 寡 转 换 可 以 投 
影 到 单位 区 间 内 ,并 且 被 当成 成 员 归 属 的 数值 。 集 中 是 把 除 0 与 1 之 外 的 所 有 
数值 都 简化 到 升 宕 的 形式 ,但 递减 的 效果 在 数值 小 的 时 候 最 弱 ;相反 ,扩散 是 令 
0 与 1 以 外 的 所 有 成 员 数值 都 递增 ,但 渐 增 的 效果 在 数值 大 的 时 候 最 弱 。 图 2. 1 
呈现 了 这 种 效果 ,图 2. 2 显示 了 集中 与 扩散 对 前 文 提 到 的 穷人 的 归属 函数 
Poor(x) 的 作用 。 


转换 的 成 员 值 





% 0.10.20.30.40.50.60.70.80.9 1 


成 员 值 
---- 扩 散 ”一 一 未 转换 。 一 一 集中 
图 2.1 集中 与 扩散 
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45 20 25 30 35 
收入 (1000 美 元 ) 
Poor(z) 一 一 集中  ---- 扩 散 


2.2 集中 与 扩散 对 穷人 的 归属 函数 Poor(x) 的 作用 


对 模糊 集合 理论 用 来 模拟 这 些 日 常 自然 语言 的 适 切 性 ,又 称 “ 语 言 学 藩 
篇 ”, 质 疑 最 力 的 是 数学 家 勒 考 夫 , 特 别 是 在 是 否 可 以 用 扩散 来 模拟 * 有 点 ”一 词 
这 个 问题 上 (Lakoff，1973) 。 史 密生 对 哲学 与 认 知 科学 的 相关 文献 提供 了 延伸 
的 讨论 。 然 而 ,我 们 并 不 预 设 模糊 集合 理论 是 自然 语言 最 佳 的 模型 ,但 它 在 系 
统 性 的 逻辑 重建 上 ,能 模拟 科学 家 操作 的 正式 语言 。 对 模糊 集合 理论 最 好 的 评 
判 标准 就 是 它 能 否 提供 有 效 的 结论 。 我 们 将 在 第 3 章 中 进一步 讨论 模糊 集合 归 
属 的 数值 转换 ,并 在 第 6 章 里 展示 集中 与 扩散 的 应 用 实例 。 对 其 广泛 应 用 的 一 
个 反对 意见 是 ,它们 需要 高 水 平 的 测量 ,这 比 多 数 使 用 者 所 期 望 的 还 困难 。 

我 们 最 后 讨论 的 模糊 集合 公式 是 模糊 加 总 ,以 符号 “T” 来 表示 。 因 此 ,集合 
X 5Y 的 加 总 就 表示 为 XTY ,而 集合 X、Y 与 Z 的 加 总 就 表示 成 XTYTZ。 经 
典 集合 运算 有 两 个 连接 法 一 一 并 集 与 交集 ,而 且 已 经 运用 于 模糊 集合 。 前 文 提 
及 ,并 集 的 成 员 归属 是 由 集合 里 归属 程度 的 极 大 值 来 决定 的 ,然而 交集 的 成 员 
归属 是 由 集合 里 归属 程度 的 极 小 值 来 决定 的 。 这 里 经 常 提 及 最 强 连接 /最 弱 连 
接 的 比喻 ,因为 并 集 的 归属 值 是 用 数 串 里 的 最 强 连 接 , 而 交集 的 归属 值 是 用 数 
串 里 的 最 弱 连 接 来 决定 的 。 在 这 个 意义 上 ,模糊 并 集 是 完全 补偿 性 的 ,在 集合 
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A EE BRA C 里 较 低 的 归属 值 可 以 被 集合 忆 里 较 高 的 归属 值 所 补偿 ,但 是 
HRE D 的 归属 值 也 一 样 偏 低 时 ,集合 A、 集 合 BRE C 的 数值 就 不 能 补偿 
之 。 换 句 话 说 ,模糊 并 集 模拟 了 多 余 的 因果 关系 ,而 模糊 交集 则 模拟 了 共生 的 
因果 关系 。 

然而 ,在 许多 情况 下 ,理论 告诉 我 们 ,在 加 总 过 程 中 ,许多 特质 贡献 于 整体 
归属 值 ,而 且 其 中 一 个 偏 低 的 归属 值 可 能 无 法 被 其 他 集合 里 较 高 的 数值 所 补 
偿 , 这 就 违反 了 模糊 并 集 公 式 。 事 实 上 , 这 种 情况 与 建构 因子 分 析 时 使 用 的 假 
设 非常 相似 ,也 就 是 各 种 组 成 成 分 整体 上 有 加 总 的 效果 。 虽 然 有 很 多 加 总 公 
式 , 但 在 此 ,我 们 只 讨论 比较 简单 的 两 种 。 第 一 种 是 归属 函数 的 几何 平均 : 


Mary TV MrM y 


几何 平均 的 运作 类 似 为 彼此 相近 的 归属 值 取 平均 ,但 是 在 归属 值 接 近 于 0 的 时 
候 更 像 是 交集 。 第 二 种 公式 是 并 集 与 交集 的 算数 平均 : 





max(mz, my) H min(mz, my) 
Mary = 





在 两 个 集合 的 例子 中 ,这 等 于 是 归属 值 的 算数 平均 ,但 在 3 个 以 上 的 集合 相 加 
时 ,就 未 必 如 此 。 更 复杂 的 运算 公式 一 一 前 面 的 两 种 都 是 其 特殊 化 的 变化 一 一 
可 以 在 相关 著作 中 (Zimmerman，1993) 找 到 讨论 细节 。 如 果 我 们 把 “常见 的 且 
酸 的 ?通过 几何 平均 加 总 ,那么 我 们 可 以 得 到 脐橙 的 数据 ， 





V1. 00 X 0. 25 = 0. 50 
而 其 算数 平均 则 是 (1. 00 十 0. 25) /2 = 0. 675。 对 这 些 加 总 方式 的 解释 属于 实际 
理论 所 探讨 的 范围 。 
层级 集合 
层级 集合 提供 了 清晰 集合 与 模糊 集合 的 有 用 联系 。 从 模糊 集合 X 开始 ,我 
们 引进 一 个 层级 指数 ,XE[0, 1], 而 且 令 集合 站 == {x EC X |m >11}. 用 文字 表 
述 , 即 Y 是 从 模糊 集合 XX 中 创造 出 来 的 经 典 ( 双 元 ) 集 合 ,其 中 ,部 分 归属 值 大 
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FA, (RUE X = {(a, 0),(b, 0.2),(c, 0.3),(d, 0.6), Ce, 0.8), f, 1}, WI 
Yo ={a, b, c, d, e, f}, Yos = {d, e, f}, 因此 ,Yi = (f}. BRB, 4a>on, 
Y, C Yo. 就 像 前 例 所 见 , Yı C Yo.5 C Yo 。 层 级 集合 的 用 途 之 一 是 绘制 偶发 分 
配 表 。 以 水 果 集 合 为 例 ， 常 见 的 .5 与“ 酸 的 o.5 ?交互 表 可 以 绘 成 表 2. 4。 


表 2.4 层级 集合 所 产生 的 交互 表 





常见 的 os = 0 常见 的 os = 1 
酸 的 ,5 一 0 4 6 


模糊 数据 与 模糊 变量 


“ 几 个 ”是 个 数值 吗 ? 这 个 词 显 然 包 含 数据 的 信息 ,但 是 很 模糊 。 它 可 以 用 
来 指 涉 某 些 可 能 的 整数 范围 ,其 中 有 些 比 其 他 的 更 接近 “ 几 个 ”。“ 几 个 ”并 不 指 
涉 一 个 整数 , 它 相当 不 清楚 。 依 据 模糊 集合 理论 , 像 “ 几 个 ”这 种 数量 词 ,可 以 用 
一 个 模糊 集合 使 之 变 得 精确 。 史 密生 曾 提供 从 23 个 大 学 生 调 查 得 到 的 数据 ,以 
赋予 “ 几 个 ”更 精确 的 意义 ,如 图 2. 3 所 示 , 画 出 归属 值 的 平均 数 与 士 2 个 标准 误 





QL284 567 8 Ilie 


zx 





----m(x)—2s —— m (x) —-—-m(x)+2s 


图 2.3 “ 几 个 ”模糊 数据 
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(已 经 截取 到 单位 区 间 内 )。 人 们 被 要 求 在 有 限 的 回答 范围 内 ,给 每 个 数字 一 个 
有 数值 的 归属 比率 ,并 且 投 影 到 单位 区 间 内 。 很 明显 ,分 布 的 波峰 在 6 之 上 , 依 
据 个 人 主观 的 判断 ,5 到 8 是 最 符合 “ 几 个 ”含义 的 数字 。 以 量化 答案 来 理解 不 
确定 性 的 程度 是 可 行 的 。 模 糊 变量 提供 了 一 种 把 定性 的 语言 转译 成 定量 命题 
的 方法 ,可 以 让 “高 度 不 可 能 ”这 一 类 用 词 变 得 更 精确 。 

这 些 想法 可 以 一 般 化 为 模糊 变量 的 概念 。 例 如 ,针对 青少年 性 行为 的 调查 
问卷 可 能 会 问 :“ 你 过 去 一 个 月 有 过 多 少 次 性 行为 ?” 回 答 项 目 可 能 是 {没有 , 几 
次 ,多 次 ,许多 次 ) ,通常 的 处 理 方式 是 ,把 回答 划 成 几 个 互相 分 隔 的 区 间 , 比 如 
{0, [1, 4], [5, 8], [9,，30]) ,当然 可 能 有 其 他 解法 ,这 些 分 析 的 解决 方案 能 
够 把 定性 的 回答 用 比较 清晰 的 方式 来 量化 。 此 外 ,我 们 可 以 用 类 似 前 面 创 造 
出 “ 几 个 ”的 模糊 数据 方式 来 定义 各 个 答案 ,因此 ,可 以 让 我 们 对 该 问题 有 一 
个 更 清楚 的 概念 。 图 2. 4 表示 ,这些 回 答 可 以 被 投影 在 0 到 30 的 单位 区 间 内 
而 成 为 模糊 数据 。 这 些 区 间 的 重 肆 显示 了 这 些 用 词 的 指 涉 有 一 定 程度 的 不 确 


定性 。 





一 一 上 次 。 一 一 "许多 次 ”一 一 每 天 
图 2.4 模糊 变量 "过 去 一 个 月 的 天 数 ” 
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模糊 集合 的 图 解 


对 任何 数据 分 析 来 说 ,可 视 化 都 是 关键 成 分 ,模糊 集合 的 数据 分 析 也 不 例 
外 。 任 何 数据 分 析 的 第 一 步 总 是 画图 。 我 们 将 会 用 常见 的 优良 规范 与 指引 来 
绘图 , 先 讨论 单一 模糊 集合 构成 的 图 像 ,重点 放 在 集合 本 身 及 其 数 域 ,然后 我 们 
才 讨 论 双向 变量 图 ,解释 两 组 模糊 集合 所 属 事物 归属 值 的 数 域 。 若 读者 有 兴 
趣 , 还 可 参考 杰 考 比 与 克 里 夫 兰 的 有 用 讨论 Jacoby, 1997, 1998; Cleveland, 
1993) 。 由 于 归属 函数 是 单位 区 间 里 的 一 个 数值 ,我 们 可 以 画 出 其 向 度 。 显 然 ， 
若 数 域 集合 更 结构 化 一 一 例如 ,是 数据 一 一 则 图 像 分 布 也 就 更 有 结构 ,就 像 “ 几 
个 ”所 呈现 的 图 像 ( 图 2. 3)。 在 第 5 章 中 ,我 们 会 用 点 状 图 来 显示 一 个 集合 包含 
另 一 个 集合 的 情况 。 





有 


导论 


就 像 第 2 章 里 提 到 过 的 ,运用 模糊 集合 理论 时 ,我 们 需要 做 到 两 点 :首先 ， 
精确 定义 数 域 XxX。 事物 的 全 集 包括 什么 ?这 可 以 包括 一 些 容易 列 出 名 单 的 集 
合 , 例 如 ,全 世界 的 所 有 国家 或 世界 500 强 企 业 , 或 是 所 有 小 于 100 BAD A. BR 
然 实际 上 可 能 还 没有 这 样 的 名 单 。 其 次 ,对 X 内 所 属 模糊 集合 的 事物 赋予 归 
属 程度 或 数值 。 这 个 模糊 集合 究竟 代表 哪些 性 质 ? 归属 值 的 等 级 究竟 是 什么 
意义 ? 

本 章 我 们 主要 关注 第 二 项 任务 。 我 们 将 从 “成 员 归 属 的 程度 ”开始 谈 , 之 后 
回顾 模糊 集合 理论 中 归属 函数 运算 的 要 点 ,然后 讨论 归属 函数 的 测量 性 质 并 且 
将 之 与 社会 科学 测量 的 文献 相 联系 。 最 后 ,我 们 讨论 成 员 归 属 赋值 与 归属 函数 
建构 的 策略 ,包括 较 少 被 注意 到 的 归属 赋值 里 的 测量 误差 问题 。 我 们 会 用 例子 
贯穿 全 章 来 说 明 重 点 。 弗 桂 能 对 本 章 提 及 的 重点 有 更 详尽 的 探讨 ,同时 也 指出 
了 数 域 空 间 不 适当 所 造成 的 后 果 。 

我 们 要 提前 指出 一 点 :对 所 用 的 集合 ,谨慎 清晰 地 概念 化 之 是 必须 的 工作 。 
不 幸 的 是 ,就 像 阿 考 克 与 柯 里 尔 指出 的 ,许多 社会 科学 概念 本 质 上 具有 争议 性 
是 由 于 缺乏 单一 且 精 确 的 定义 (Adcock & Collier, 2001)。 这 里 , 举 出 3 个 来 自 
经 济 学 政治 学 与 临床 心理 学 的 例子 ,来 说 明 缺 乏 谨 慎 的 概念 化 与 测量 所 导致 
的 持续 纷争 :(1) 不 同 论述 的 背景 观念 引出 对 贫穷 与 不 平等 的 各 种 不 同 概念 , 选 
择 不 同 的 观点 就 导致 不 同 的 测量 (Ravallion，2003);(2) 由 于 对 什么 是 “真正 的 ” 
民主 有 不 同 定义 ,并 且 缺 乏 理 论 与 概念 发 展 的 谨慎 思考 ,民主 测量 的 文献 总 是 
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令 人 困惑 (Munck & Verkuilen，2002);(3) 自 第 一 版 的 (精神 症状 与 统计 手册 》 
(Diagnostic and Statistical Manua ) 在 半 世 纪 前 出 版 之 后 ,大 量 的 研究 成 果 仍 
无 法 解决 忧郁 、 焦 虑 或 精神 分 裂 等 重大 失常 症状 的 实际 认定 问题 。 对 于 审慎 思 
考 测量 议题 来 说 ,统计 技巧 并 非 必须 ,然而 某 些 技 巧 比 其 他 的 更 加 适合 测量 不 
同 选项 。 因 此 ,本 章 关 注 的 重点 是 模糊 集合 里 系统 性 的 成 员 归 属 赋值 过 程 的 必 
要 条 件 及 必须 优先 解决 的 相关 议题 。 


建构 归属 函数 的 方法 


何谓 归属 函数 ?就 像 第 2 章 提 到 的 ,正式 来 说 , 它 是 在 事物 所 属 空 间 内 (可 
以 是 量化 或 非 量 化 ) 将 某 种 特质 A 投影 在 单位 区 间 [0, 1] 之 内 的 函数 : 


ma(x): —> [0, 1] [3.1] 


它 是 测量 某 种 具备 特质 A 的 事物 x 成 为 特定 集合 内 成 员 的 程度 的 “集群 性 ? 指 
数 。 它 所 测量 的 是 “zx 是 A 的 元 素 ” 程 度 的 真实 数值 。 模 糊 集合 允许 部 分 归属 
于 某 集 合 ,所 以 变量 可 以 是 部 分 归属 的 。 例 如 ,在 给 某 个 测验 打分 数 时 ,我 们 可 
以 划分 未 通过 、 半 通过 与 全 通过 3 种 类 型 ,在 “这 题 的 正确 答案 "之 模糊 集合 中 ， 
依 序 以 归属 值 0 分 、0. 5 分 或 1 分 来 表示 。 

由 于 一 个 归属 函数 对 每 个 事物 z 只 能 赋予 一 个 数值 ,一 次 只 能 表达 一 个 向 
量 , 所 以 多 向 量 就 必须 由 多 集合 来 处 理 。 整 体 而 言 ,归属 值 只 是 潜在 的 ,不 能 直 
接 被 观察 到 ,而 且 只 能 附属 于 特定 的 解释 脉络 。 虽 然 “一 瞬 眼 ”可 以 由 与 模糊 集 
合 “ 漫 长 等 待 ” 的 关系 来 解释 ,但 这 个 集合 的 意义 只 能 依赖 对 数 域 的 认定 。 在 美 
Ea) HAS Fen FA fis a A AF LE HE 3 周 就 算 漫长 等 待 ,但 是 出 高 价 请 快递 , 花 2 天 也 
算 漫长 等 待 。 因 此 ,讨论 集合 的 脉络 必须 越 清楚 越 好 。 

归属 程度 也 需要 解释 性 的 基础 ,这 个 基础 仰赖 的 是 成 员 归属 赋值 的 过 程 。 
例如 ,要 设计 一 套 语言 分 类 方式 以 表现 对 某 事 同 意 程度 的 归属 数值 并 不 困难 ， 
但 是 对 更 精致 .更 多 渐进 类 型 的 归属 程度 赋予 数值 就 会 更 困难 。 要 定义 诸如 
“有 点 属于 ”或 者 “ 既 不 在 内 也 不 在 外 ”之 类 的 判断 性 词汇 ,其 至 赋予 其 数值 并 确 
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定 它们 被 量化 的 过 程 有 一 致 性 , 那 真是 难 上 加 难 。 然 而 ,最 令 人 困扰 的 关系 莫 
过 于 那些 介 于 有 序 等 级 与 量化 数值 之 间 的 类 型 。 在 很 多 情况 下 ,只 要 有 理论 文 
献 或 者 被 其 他 专家 使 用 过 的 判断 作为 依据 ,把 数值 0 与 1 的 归属 值 运用 到 “从 
不 ”与 “完全 ”或 “典型 "之 类 词汇 时 ,还 算 站 得 住 脚 。 但 是 如 “一 半 在 内 一 半 在 
外 ”或 者 “ 既 不 在 内 也 不 在 外 ”等 某 些 词汇 ,如 果 给 个 1/2 的 数值 , 铠 怕 争议 会 很 
大 。 然 而 ,除非 有 什么 特殊 操作 化 资格 的 依据 ,否则 比 上 述 区 分 更 细致 的 问 法 
将 更 抽象 难 解 。 与 这 种 情形 相反 的 状况 是 对 典型 赌 徒 或 决策 者 主观 概率 的 定 
义 , 一 个 事件 发 生 的 概率 值 p 表示 , 若 事 件 发 生 时 ,当事人 可 以 得 到 1 美元 ,而 
没事 就 什么 都 得 不 到 , 则 期 望 值 为 p 元 。 在 此 定义 下 ,0.4 O0. 5 的 概率 对 决策 
者 预期 的 报酬 来 说 ,有 很 清楚 的 意义 。 

即使 人 们 的 判断 有 内 在 一 致 性 ,这 种 一 致 性 也 无 法 跨越 不 同 个 体 的 主观 判 
断 ,因此 导致 了 校正 的 问题 。 华 尔 斯 腾 等 人 建构 了 一 个 主观 判断 的 概率 测量 等 
级 ,然而 仍 无 法 避免 不 同 主体 间 实 际 认 知 的 变异 ,由 于 置信 区 间 非 常 宽 ,他 们 也 
不 建议 取 平均 以 求 出 共同 认定 的 等 级 (Wallsten et al. ，1986) 。 这 表明 , 主观 归 
属 值 的 认定 不 具有 可 比较 性 ,因此 ,他 们 无 法 将 标准 化 文字 的 意义 校准 为 一 致 
的 刻度 。 

尽管 我 们 在 直觉 上 可 以 认 知 模糊 性 的 概念 与 归属 程度 ,在 查 迪 1965 年 的 经 
典 之 作 发 表 几 年 后 ,人 们 仍然 感到 困惑 ,直到 最 近 才 日 渐 清晰 。 确 实 , 现 在 有 好 
几 种 归属 程度 杰出 而 且 可 变 的 定义 。 运 用 史 密 生 等 人 所 提出 的 类 型 学 ,我 们 可 
以 把 这 些 解释 方式 分 为 4 类 ,每 一 类 都 适用 于 某 些 特定 的 研究 目的 (Smithson， 
1987:78—79; Bilgiç & Tiirksen, 2000), 

第 一 类 可 称 之 为 “形式 化 解释 ”, 也 就 是 纯粹 用 数学 概念 处 理 归属 函数 ,把 
潜在 的 支持 变量 投影 到 归属 程度 上 。 这 些 变量 通常 有 不 同 的 来 源 : 主 观 判断 的 
认定 .间接 度量 /测量 的 模型 或 者 是 客观 变量 的 测量 等 。 许 多 模糊 集合 理论 家 
自己 就 是 形式 化 模型 的 使 用 者 ,同意 使 用 0 到 1 区 间或 者 其 他 的 归属 范围 ,然后 
再 用 一 个 平滑 的 函数 定义 前 述 变量 所 有 区 间 的 归属 值 。 

案例 3.1: 人 类 发 展 指数 

相对 于 人 均 国 内 生产 总 值 (GDP) 或 者 能 源 消耗 这 两 种 常用 的 发 展 指标 , 联 
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合 国 发 展 总 署 (UNDP) 人 类 发 展 指数 (HDI) 旨 在 创造 一 个 更 广泛 、 概 念 上 更 丰 
富 的 发 展 程度 测量 (UNDP,，1999)。 人 类 发 展 指数 的 设计 者 们 将 最 高 层次 的 发 
展 概念 划分 为 3 种 成 分 , 即 经 济 、 健 康 与 教育 。 人 类 发 展 指数 隐 而 未 显 的 向 度 之 
一 , 正 是 它 可 以 被 当成 一 个 模糊 集合 。 

为 了 结合 这 些 人 类 发 展 指数 的 成 分 ,每 个 成 分 都 必须 被 给 予 一 个 普遍 的 比 
值 并 且 选 定单 位 区 间 。 此 外 ,设计 者 们 相信 ,用 这 个 指数 某 个 特定 区 间 的 上 端 
与 下 端 , 可 以 显示 从 未 发 展 到 已 完全 发 展 之 间 的 重要 关键 点 。 一 国 要 是 达到 区 
间 上 端 , 可 以 被 视 为 这 些 成 分 完全 发 展 , 一 国 如 果 掉 到 底 端 附近 , 则 可 以 被 视 为 
这 些 成 分 完全 低 度 发 展 。 区 间 两 端 之 间 的 变异 数 是 重要 的 ,但 落 到 两 端 之 外 则 
没有 太 大 意义 。 这 与 我 们 在 第 2 章 讨论 的 贫穷 线 情 况 大 致 一 样 。 表 3. 1 显示 了 
指数 的 成 分 、 用 来 测量 成 分 的 指标 、 上 下 区 间 与 给 每 种 成 分 设 定 归 属 值 的 计算 
DK 

表 3.1 人 类 发 展 指数 成 分 的 归属 值 设 定 范例 
成 ”分 指数 REA AKN 区 间 之 间 的 归属 值 











经 济 : 是 否 能 活 人 均 FT ae — ayy — log(GDPpc) — logd 00) 
得 体面 ? GDPCPPP) 100 美 元 40000 美元 ”经济 一 jog(40000) 一 Jog(100) 
健康 :是 否 能 活 “初生 预期 
得 长 久 而 健 康 ? 寿命 
教育 :有 知识 RARER oy joy 教育 = 2/3 成 人 识字 率 十 
文化 ? 与 总 人 学 率 1/3 总 人 学 率 
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形式 化 研究 者 并 不 重视 “归属 程度 ”如 何 赋予 数值 或 任何 预 设 建构 的 度量 
过 程 。 以 人 类 发 展 指数 为 例 , 设 计 者 使 用 的 是 线性 过 滤 法 ,但 他 们 其 实 也 可 以 

用 其 他 平滑 的 单调 函数 。 相 反 ,预期 寿命 函数 可 以 用 logistic 函数 : 
mH(7x) = 1/L1 tees | [3.2] 


此 处 ,a ERRE, b Æ myl) = 1/2 时 的 预期 寿命 。 假 设 a = 0.1 H b= 55t, 
曲线 如 图 3. 1 所 示 ,那么 ,线性 过 滤 法 与 logistic 归属 函数 都 会 通过 my (55) = 
1/2 这 一 点 。 其 实 , 线 性 过 滤 法 与 logistic 函数 是 相当 类 似 的 。 确 实 ,它们 高 度 
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相关 ,任何 合理 的 单调 函数 都 会 高 度 相 关 。 形 式 化 研究 者 需要 一 些 实证 或 者 理 
论 的 标准 ,才能 在 一 群 彼此 高 度 相 关 的 函数 之 间 , 选择 一 种 最 好 的 转换 方式 。 
如 弗 桂 能 注意 到 ,正式 模型 转换 途径 的 主要 问题 是 ,可 能 的 转换 函数 无 限 多 ,但 
其 中 特别 适当 的 选择 并 不 明显 。 然 而 ,转换 方式 又 是 赋予 归属 数值 最 重要 的 成 
分 ,无 论 其 估算 的 基础 是 怎么 得 来 的 。 





0 20 40 60 80 100 
预期 寿命 


一 一 线性 ---- logistic 


图 3.1 线性 过 滤 法 与 logistic 归属 函数 


第 二 类 是 所 谓 的 “概率 化 解释 ”, 也 就 是 以 概率 为 基础 ,赋予 归属 程度 。 最 
直观 的 方法 就 是 将 事物 r 在 集合 A 的 成 员 归 属 值 等 同 于 z 属于 A 的 概率 。 这 
个 概率 可 以 来 自 单一 判断 的 主观 评价 ,也 可 以 来 自 另 外 两 种 方法 一 一 第 一 种 是 
把 并 属于 4 的 人 在 样本 中 的 比例 当成 归属 值 ;第 二 种 是 把 “> 在 一 定 程度 上 属 
于 A” 的 人 在 样本 中 的 比例 当成 归属 值 。 

这 种 解释 方式 有 时 又 叫做 对 模糊 归属 的 “随机 集合 ”观点 。 如 果 在 前 述 “ 几 
个 ”的 模糊 集合 里 ,4 次 被 赋予 0.7 的 数值 ,那么 ,调查 人 员 对 选择 4 次 的 解释 
是 :70% 的 受 访 者 认为 “ 几 个 ”应 该 是 指 4 个 。 随 机 集合 对 0. 7 的 解释 是 ,在 从 4 
到 7 的 数值 区 间 里 ,认定 “ 儿 个 ”是 4 个 的 人 有 70%。 昌 然 很 多 模糊 集合 研究 者 
排斥 归属 程度 的 概率 化 观点 ,但 在 某 些 案例 里 , 随机 集合 观点 还 是 具备 高 度 一 
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致 性 与 解释 上 的 优势 。 在 第 5 章 ,我 们 将 讨论 决定 子 集 关系 的 固定 包含 途径 法 ， 
并 对 随机 集合 提出 自然 的 解释 。 

当然 ,形式 化 与 概率 化 的 想法 可 以 用 概率 分 布 转换 为 归属 函数 的 方式 加 以 
合并 。 有 研究 者 根据 既 有 人 口 与 各 相关 变量 (例如 ,收入 ) 的 累积 分 布 函 数 
(CDF) ,设计 了 一 个 贫穷 线 的 模糊 归属 函数 ,他 们 根据 一 个 原始 估计 值 (xo) 的 
瓶颈 来 定义 0 类 (Cheli & Lemmi，1995) ,其 归属 函数 为 ， 


mp (x)=max[0, (F(r) —F(20))/C1—F20)) J [3.3] 





此 处 ,F(z) 是 xz 的 累积 分 布 函数 ,该 公式 可 以 应 用 到 任何 有 累积 分 布 函 数 的 变 
量 上 ,而 且 事 实 上 ,这 是 个 截断 的 累积 分 布 函 数 。 这 个 取向 的 推广 性 是 可 以 想 
见 的 。 

对 概率 化 解释 的 推广 者 (Hisdal，1988; Thomas，1995) 而 言 ,他 们 认为 , 归 
属 等 级 就 跟 主观 概率 一 样 ,反映 了 知识 的 不 完善 与 /或 分 类 上 的 误差 ,这 也 就 瞳 
示 了 ,在 完善 的 知识 与 无 误 的 分 类 下 ,模糊 归属 的 等 级 根本 不 会 存在 。 反 对 之 
说 则 认为 ,对 归属 等 级 的 判断 根本 不 需要 从 不 完善 的 知识 或 者 误差 而 来 ,事实 
上 ,值得 信赖 的 专家 就 可 以 预测 之 。 比 如 ,与 新 手相 比 ,那些 可 以 分 辨 " 暖 ? 绿 色 
与 “ 冷 " 绿 色 的 艺术 家 们 知道 ,前 者 其 实 含 有 少许 红色 ,他 们 根本 不 用 冒险 猜测 
结果 。 同 样 ,一 个 在 测验 中 获得 部 分 成 绩 的 学 生 通 常 也 拥有 部 分 相关 知识 ,这 
不 是 赌 来 的 结论 ;在 缺乏 更 完整 信息 的 情况 下 再 次 参加 考试 时 , 这 个 学 生 极 有 
可 能 仍 重 复 答 对 与 答 错 的 部 分 。 

第 三 类 是 赋予 归属 值 的 决策 理论 观点 。 在 这 个 取向 中 ,成 员 归 属 程度 取决 
于 宣称 zx 属于 A 所 得 到 的 效用 (代价 ), 这 当然 与 + 属于 A 的 真实 程度 相关 
(Giles, 1988)。 决 策 理 论 观点 的 早期 版 本 是 与 概率 论 的 信号 侦 测 理论 (SDT) 相 
结合 的 ,其 中 ,预期 + 属于 A 相对 于 x 属于 ~A 的 效用 与 z+ 值 或 背后 相关 变量 
的 命题 共 变 。 无 论 是 效用 论 或 者 信号 侦 测 理论 的 架构 ,都 把 “少许 ”或 “ 几 个 ”之 
类 的 标签 当成 从 一 个 卷 标 组 合 ( 通 常 是 有 限 数 量 ) 里 选 出 来 的 。 因 此 ,这 些 架 构 
可 以 运用 到 那些 真正 做 决策 的 例子 上 (例如 ,是 否 发 布 警报 或 者 应 该 把 看 到 的 
数量 称 为 “少许 ”还 是 “ 几 个 ”)。 这 背后 的 假定 不 是 我 们 只 有 有 限 的 知识 ,而 是 
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只 有 少数 的 选择 。 就 像 形 式 主 义 者 一 样 , 决 策 理论 观点 把 效用 等 级 的 来 源 问 题 
放 在 一 边 ,而 寄 希 望 于 得 到 建构 效用 等 级 的 方法 。 

第 四 类 学 者 来 自 那些 把 归属 值 看 成 公理 测量 理论 议题 的 人 (Krantz，Luce， 
Suppes & Tversky, 1971; Michell, 1990)。 根 据 公 理 取 向 ,我 们 应 该 可 以 把 归 
属 数值 的 设 定量 化 为 极 小 的 数 点 。 

这 个 取向 的 重点 在 于 认为 量化 结构 的 归属 等 级 可 以 拆 解 成 质 化 公理 条 件 
的 集合 ,并 且 能 够 也 应 该 以 实证 方式 呈现 ,以 下 是 一 些 例 子 。 华 尔 斯 腾 等 人 的 
研究 为 模糊 集合 理论 竖立 了 黄金 标准 ,因为 公理 方法 被 用 来 呈现 主观 符合 某 性 
质 的 等 级 比率 ,可 推导 出 的 归属 值 (Wallsten et al. ，1986) 。 弗 桂 能 提出 了 一 个 
使 用 Bradly-Terry-Luce (BTL) 模 型 转换 的 简单 案例 ,在 一 些 医疗 职业 之 中 , 根 
据 声望 作为 选择 的 判断 ,在 “有 声望 的 医疗 职业 ”的 模糊 集合 上 形成 了 一 个 归属 
函数 。 这 个 由 BTL 模型 产生 的 偏好 等 级 有 一 个 公理 基础 :在 模型 配 适 后 , 它 满 
足 一 个 强 效用 等 级 的 公理 ,并 且 产 生 事物 的 等 距 比率 。 最 近 , 有 学 者 研究 介绍 
了 在 模糊 集合 的 脉络 下 , 使 用 比较 法 与 主观 比率 等 级 产生 归属 值 的 办 法 
(Marchant，2004a、2004b)。 最 后 ,有 研究 者 从 公理 测量 理论 的 角度 阐释 了 认 
知 模糊 逻辑 模型 (FLMP) ,在 认 知 模糊 逻辑 模型 来 看 , 受 测 主体 所 提供 的 是 在 一 
群集 合 里 对 归属 值 的 直接 评价 ,这 可 以 用 来 产生 对 选择 的 预测 。 该 研究 显示 ， 
FLMP 模型 与 BTL 模型 是 相同 的 ,差别 仅 在 于 ,主体 提供 的 是 等 距 数值 而 非 
选择 。 

计量 心理 学 与 公理 化 测量 之 间 的 关联 性 似乎 在 本 书 中 被 加 强 了 。 一 方面 ， 
计算 能 力 追 上 了 检验 测量 公理 时 极端 严格 的 需要 ,已 经 能 为 杂乱 信息 里 的 代 
数 / 决 定论 的 测量 模型 提供 理性 而 有 概率 基础 的 检验 。 另 一 方面 ,与 依赖 数据 
的 拟 合 度 检 验 相 比 ,公理 化 方法 往往 能 提供 更 犀利 的 不 配 适 模型 指数 。 例 如 ， 
著名 的 Rasch 或 者 单 变量 logistic, 或 项 目 反应 理论 模型 (也 就 是 数学 上 与 
Bradley-Terry-Luce 相同 的 模型 ) 都 符合 共生 测量 公理 ,因此 可 以 产生 等 距 的 信 
息 。 在 Rasch 模型 的 脉络 下 ,主观 与 项 目 式 的 推论 都 可 根据 公理 条 件 而 获得 改 
进 (Karabatsos & Ullrich，2002) 。 在 这 个 领域 中 ,超越 早期 简单 研究 的 进一步 
发 展 将 很 有 帮助 。 
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所 以 在 上 述 4 个 取向 一 一 形式 化 论 、 概 率 化 论 、 决 策 理论 与 公理 方法 一 一 
中 ,何者 是 比较 正确 的 呢 ? 我们 认为 ,上 述 4 种 都 不 完全 正确 。 如 果 研 究 者 的 问 
题 比 较 接近 决策 理论 的 问题 ,那么 决策 理论 的 工具 可 能 比较 相关 。 此 外 ,如 果 
我 们 想 要 对 归属 函数 提出 某 种 特殊 的 计算 方式 ,公理 化 测量 可 能 是 最 佳 的 观 
点 。 总 之 ,我 们 认为 ,对 每 种 方法 抱 一 种 普遍 的 怀疑 态度 并 审慎 选择 才 是 健康 
的 治学 态度 。 同 时 ,研究 中 有 机 会 合并 使 用 多 种 取向 。 





模糊 集合 所 需 的 测量 特质 


在 模糊 集合 中 ,成 员 归 属 的 诠释 具 变 异性 ,而 且 从 测量 的 性 质 来 看 ,在 归属 
函数 的 拟 合 度 变化 极 大 的 条 件 下 ,我 们 应 该 思考 我 们 所 用 假设 的 脆弱 程度 ,并 
且 受 善 运用 模糊 集合 。 昌 然 从 统计 显著 性 来 看 ,在 清晰 的 结论 与 强烈 的 假设 之 
间 ,往往 必须 作出 取舍 ,但 我 们 应 可 以 考虑 少数 或 / 且 较 弱 的 假设 。 

“ 极 小 化 派 ”归属 赋值 的 方法 采取 类 似 (0 = 必然 非 成 员 , 可 能 的 成 员 ,1 = 
必然 是 成 员 } 的 作法 。 中 间 程 度 成 员 归 属 ( 因 此 有 模糊 性 ?的 案例 则 依赖 事物 的 
比较 (例如 ,z 与 y), 如 判别 x 是否 比 y 更 接近 于 集合 A。 假 设 这 比较 中 有 3 个 
样本 ,其 不 平等 的 排序 为 ma (x) > maly) > male), 则 归属 值 可 能 出 现在 0 与 
1 之 间 , 这 就 使 A 成 为 一 个 模糊 集合 。 

或 许 让 人 感到 惊讶 的 是 ,多 数 模糊 集合 可 以 有 效 运用 某 种 极 小 化 赋值 法 ， 
我 们 仍 可 运用 模糊 并 集 与 交集 的 极 大 或 极 小 运算 。 概 率 化 观点 与 决策 理论 观 
点 则 导致 拒绝 使 用 极 大 与 极 小 运算 公式 的 结果 (Hisdal，1988) 。 由 于 公理 化 测 
量 架 构 采 取 归 属 值 (公理 ?的 质 化 条 件 , 因 此 必须 用 极 大 与 极 小 计算 公式 (例如 ， 
Bollman-Sdorra, Wong & Yao, 1993; Yager, 1979)。 然 而 ,相对 于 其 他 强大 到 
足以 产生 等 距 或 数 率 的 测量 的 集合 运算 (如 累加 方式 ) ,采取 极 大 一 极 小 计算 公 
RAYA Fl ,反之 , 极 大 一 极 小 公式 最 适合 定 序 的 数列 。 

余 集 的 计算 更 有 问题 。 概 率 化 与 决策 理论 的 观点 依赖 于 对 余 集 的 标准 定 
X: m~A (x) 三 1 一 ma (x)。 更 有 其 者 , 某 些 测量 学 者 不 正确 地 认为 ,数值 比率 在 
缺乏 [0, 1j] 之 类 的 固定 区 间 时 ,将 无 法 形成 余 集 。 然 而 , 史 密 生 指 出 ,即使 没有 固 
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定 区 间 ,在 定 序 归 属 值 下 ,只 要 有 一 个 被 接受 的 中 立 点 (9) ,就 足以 支持 一 个 余 集 
的 “镜像 ”定义 (Smithson，1987: 86—88), x 镜像 是 2g 一 zx, 因此 ma (2g 一 
x) 三 1 一 mA (z)。 极 小 化 论 者 的 赋值 是 (0 = 必然 非 成 员 ,可 能 的 成 员 ,1 = 必然 
ERR), 即使 不 给 “可 能 的 成 员 ” 赋 值 , 也 可 计算 出 余 集 。 

在 有 明确 定义 归属 函数 的 模糊 集合 之 间 , 比较 可 能 还 没 问题 (如 果 有 人 愿 
意 建立 或 假设 其 可 比 性 ) ,但 在 不 同 归 属 数值 形态 之 间 的 模糊 集合 进行 比较 就 
异常 困难 。 归 属 值 测量 依赖 同一 集合 内 事物 的 比较 ,以 判别 x 是 否 比 y 更 接近 
于 集合 A。 相 对 而 言 ,性 质 排序 是 根据 不 同 集合 之 间 对 相同 事物 的 比较 , 亦 即 相 
对 于 集合 B, x 是 否 更 接近 于 集合 A 。 如 果 我 们 无 法 建立 性 质 排序 , 则 无 论 集合 
A 或 集合 B 的 归属 函数 层级 有 何 关 系 , 集 合 A 与 集合 B 内 的 归属 程度 根本 是 不 
可 比较 的 。 

如 果 集 合 间 使 用 同样 的 度量 标准 , 则 在 性 质 排序 时 ,往往 简单 假设 彼此 之 
间 的 归属 值 相等 ,即使 在 某 些 情况 下 ,这 个 假设 是 有 争议 的 。 除 非 ( 且 更 常见 
的 ) 我 们 在 比较 时 必须 给 定 不 同 集合 之 归属 层级 的 同一 个 排序 。 如 果 我 们 是 比 
较 " 芋 果 ” 的 某 个 向 度 与 “橘子 ”的 另 一 向 度 , 共 同 排序 可 能 极为 困难 。 我 们 将 在 
第 4 章 与 第 5 章 继续 讨论 这 些 议 题 。 然 而 ,这 一 节 的 重点 在 于 ,模糊 集合 的 架构 
会 迫使 研究 者 在 测量 的 性 质 上 作出 选择 。 最 后 ,我 们 还 是 要 决定 ,在 集合 里 的 
是 什么 ? 什么 要 排除 到 集合 外 ? 有 哪些 是 既 非 集合 内 也 非 集合 外 的 ? 如 果 要 
给 归属 赋值 一 种 度量 ,那么 ,对 完全 归属 、 部 分 归属 与 非 成 员 的 部 分 ,都 必须 同 
时 建立 依据 此 度量 的 标准 。 


归属 函数 的 测量 特质 


我 们 该 如 何 决定 归属 函数 的 测量 层级 ? 模糊 集合 的 研究 者 曾 运 用 的 层级 
从 定 序 ( 独 特 与 单调 转换 ) 、 绝 对 值 到 单一 的 都 有 (Bilgic & Tiirksen，2000) 。 模 
糊 集 合 与 社会 科学 共享 这 种 多 样 性 ,其 变量 的 测量 性 质 仍然 引起 争论 (Michell， 
1997)。 我 们 因 篇 幅 有 限 , 无 法 回顾 这 些 争 论 , 但 若 读者 想 了 解 这 些 争论 ,可 以 
通过 使 用 模糊 集合 来 掌握 测量 议题 。 
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数据 理论 里 有 一 个 核心 重点 值得 在 此 强调 :从 没有 一 个 测量 层级 明显 附属 
于 一 个 变量 。 相 反 , 对 每 个 特定 议题 来 说 ,测量 的 层级 总 是 要 经 过 调整 ,才能 符 
合 其 情境 。 确 实 ,在 社会 或 心理 研究 中 ,即使 是 完美 定义 其 物理 意义 的 定 比 层 
级 测量 (例如 ,反应 时 间或 电量 ) ,也 未 必 能 够 与 感 兴趣 的 行为 产生 明显 的 联系 。 
例如 ,国家 财政 税收 占 收入 的 百分比 一 一 经 常 被 用 来 测量 国家 能 力 一 一 有 时 被 
当成 是 一 个 “明显 的 比率 ”测量 的 例子 ,但 是 谈 到 0%( 索 马利亚 ) 与 10%( 巴 拉 
圭 ) 是 否 与 30%( 西 班 牙 ) 及 40% (意大利 ) 相 等 ,在 国家 能 力 的 概念 上 ,我 们 实 
在 很 难说 它们 具有 同样 差距 (Lieberman，2000) 。 从 真正 的 国家 能 力 来 看 ,第 一 
组 的 差别 是 从 没有 到 可 能 足以 巩固 ,第 二 组 的 差别 可 能 只 是 税收 政策 稍 作 改变 
而 造成 的 。 

总 之 ,观察 数据 与 概念 变量 之 间 的 关系 ,通常 依赖 研究 者 的 界定 ,这 是 研究 
者 的 义务 。 弗 桂 能 注意 到 ,数据 与 概念 变量 的 关系 经 常 被 “ 越 多 ( 少 ) 越 好 ”的 观 
点 所 主导 , 即 数据 与 概念 的 关系 是 单调 的 ,而 且 “ 刚 刚好 ”, 亦 即 在 数值 之 间 , 总 
是 找 得 到 理想 定点 ,使 归属 程度 从 最 高 点 开始 下 滑 。 此 外 ,多 数 模 糊 集 合 的 运 
用 都 隐 含 着 效果 递减 的 想法 ,在 接近 两 极 (0 与 1) 时 ,归属 值 上 升 或 下 降 的 变化 
应 该 相对 减缓 。 

什么 样 的 测量 性 质 可 以 界定 一 个 归属 函数 ,以 超越 前 述 的 简单 必然 性 ? 对 
某 模糊 集合 A 来 说 ,任何 事物 的 群集 {zx1，zx2z,，…， zs} 都 可 以 依据 对 A 的 归属 
程度 来 排序 ,所 以 : 


ma (x1) S ma (x2) Ss < ma (x1) K ma (zg) [3.4] 


如 前 文 所 述 ,我 们 必须 严格 定义 其 中 两 个 不 平等 ,也 就 是 说 ,必须 有 on i 与 


x js malar) S malazi) S malaj). 


此 外 ,归属 函数 应 该 有 两 个 终端 ,分 别 代 表 完 全 归属 与 完全 非 归 属 。 此 时 ， 
我 们 已 经 移 到 更 高 水 平 的 、 或 许 是 被 标准 教科 书 忽 略 的 测量 :在 0 与 1 之 间 的 排 
序 。 在 这 个 情况 下 ,我 们 可 以 定义 : 

0< ma (a1) SQ < ma (ai) CS < ma Caz) [3.5] 
<te S ma Crea) Sma (ae) K1 
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对 每 个 zx; 来 说 ,如 果 我 们 让 ma Cri) <1/2 BK ma (zi) 宇 1/2, 则 我 们 还 是 能 
得 到 一 个 比较 结构 性 而 非 简单 的 定 序 度量 。 在 第 4 章 , 我 们 将 运用 一 个 包括 非 
归属 者 .近乎 非 归属 者 .近乎 完全 归属 者 与 完全 归属 者 的 归属 函数 。 如 果 我 们 
能 界定 一 件 事物 neutral , 令 MA (Xreutral) = 1/2 且 该 模糊 集合 是 常态 的 (也 就 是 
最 少 有 一 件 事物 的 归属 值 为 0, 另 一 件 为 1) ,我 们 将 会 更 有 结构 性 。 总 之 ,从 对 
事物 归属 值 的 一 个 微弱 定 序 开始 , 随 着 我 们 认定 越 来 越 多 事物 附属 的 归属 程度 
数 点 ,我们 也 将 可 能 的 归属 值 限制 在 更 细致 的 层次 上 。 

从 或 多 或 少 在 被 限制 的 准 排序 度量 朝 真 正 量化 的 归属 函数 转换 ,需要 非 
常 强 的 假设 ,尤其 是 诱导 方法 或 是 以 实证 为 基础 的 度量 技巧 ,这 些 并 没有 超 
越 社 会 科学 的 传统 测量 或 是 度量 建构 模型 的 范围 , 主要 的 差异 在 于 对 完全 归 
属 、 非 归属 及 /或 中 立 点 界定 其 度量 基准 点 。 这 并 不 代表 获得 真正 量化 的 归属 
函数 很 简单 ,然而 ,经 常 发 生 而 且 更 直接 的 是 ,在 既定 的 运用 时 ,对 变量 的 可 
能 范围 采用 敏感 度 分 析 , 以 显示 归属 值 在 遭 到 扰乱 时 也 不 会 改变 。 确 实 , 在 
控制 系统 理论 对 模糊 集合 理论 的 运用 上 ,这 是 很 广泛 的 操作 方式 。 这 种 做 法 
的 缺点 在 于 ,因为 没有 增加 任何 效 度 ,这 种 度量 可 否 推广 到 其 他 运用 方面 尚 
存疑 。 

对 成 员 函 数 的 最 直接 的 操作 方式 是 在 界定 终端 的 同时 ,使 用 一 种 既 有 支持 
变量 的 性 质 。 如 果 我 们 以 界定 两 边 终端 的 方式 把 单一 变量 投影 到 归属 值 上 ,就 
可 以 插入 介 于 其 间 的 归属 值 。 事 实 上 , 这 正 是 线性 过 滤 法 所 做 的 ,两 个 终端 中 
间 数 据 的 插 补 用 的 是 一 条 线性 函数 ,人 类 发 展 指数 的 例子 就 完全 奠基 于 这 种 方 
式 。 尽 管线 性 过 滤 法 经 常 运 作 良 好 ,而 且 又 有 精简 的 优点 (就 像 logistic 函数 所 
显示 的 ) ,但 我 们 事实 上 可 以 选择 不 同 的 插 补 函数 。 如 果 我 们 愿意 界定 中 立 点 
或 者 其 他 内 部 参照 点 ,也 可 以 使 用 分 段 插 补 函数 ,例如 ,分 段 线性 或 者 三 次 方 
程 , 视 我 们 希望 得 到 的 函数 的 平滑 程度 而 定 。 参 照 点 为 控制 插 补 函数 的 形状 提 
供 了 更 多 的 信息 。 

基于 数据 收集 的 方法 ,我 们 可 能 获取 更 多 有 关 排 序 本 身 的 信息 。 在 收集 数 
据 时 提供 实际 的 多 余 信 息 ,就 可 能 允许 对 效 度 的 互相 检定 与 模型 配 适 (Coombs， 
1951) 。 假 设 排 序 性 质 允 许 人 们 检查 回答 是 否 为 定 序 的 方法 提供 了 有 用 的 工 
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具 , 同 样 的 原则 也 适用 于 更 高 层次 的 测量 。 确 实 ,这 正 是 公理 测量 理论 所 探讨 
的 ,测量 模型 通常 允许 假设 检定 并 且 ”* 提 升 ? 定 序 测量 到 更 高 的 层次 。 这 种 方法 
包括 在 喜好 与 能 力 测 试 中 ,使 用 项 目 反 应 理论 方法 和 适合 态度 测量 的 更 弹性 化 
的 模型 (Rossi，Gilula & Allenby,，2001) 。 事 实 上 ,所 有 的 方法 大 多 引用 probit 
模型 或 logit 模型 ,用 一 个 相应 于 定 序 分 类 的 等 距 潜 在 连续 值 去 估计 “瓶颈 ” 数 
值 。 如 果 我 们 有 标准 来 指定 一 定 的 瓶颈 ,如 非 归 属 、. 中 立 、 且 /或 完全 归属 的 截 
点 ,我 们 就 可 以 用 线性 过 滤 法 或 者 适当 的 曲线 来 插 补 归属 值 。 总 之 ,从 主观 判 
断 到 直接 赋予 归属 值 间 接 度量 的 方法 (例如 ,项 目 反 应 理论 模型 或 最 适度 量 )， 
再 到 基础 测量 法 ,计量 心理 学 与 度量 技巧 的 方法 仍 是 开放 的 。 


成 员 归 属 定义 的 不 确定 性 估计 


“我 们 应 该 在 括号 里 放 些 什么 ? 对 完善 的 计量 经 济 学 来 说 ,最 基本 的 原则 
就 是 ,每 个 认真 的 测量 都 值得 加 上 一 个 标准 误 。”(Koenker & Hallock，2001) 除 
了 模糊 性 与 概率 之 间 令 人 困惑 的 关系 以 及 对 归属 函数 性 质 的 不 同意 见 之 外 ,在 
操作 意义 上 ,很 少 有 人 留意 到 应 该 对 归属 函数 提供 不 确定 性 的 估计 ,这 是 个 很 
严重 的 缺失 。 对 任何 类 型 的 测量 来 说 ,我 们 没有 理由 相信 归属 赋值 没有 误差 ， 
而 且 提 供 误差 程度 是 研究 者 的 义务 。 模 糊 集合 理论 的 发 展 一 直 缺 乏 误 差 的 正 
式 理论 ,这 是 因为 在 工程 学 上 ,通常 可 以 用 许多 测试 去 显示 机 构 运 作 的 妥当 性 。 
不 幸 的 是 ,经 验 科 学 家 的 关怀 没有 得 到 重视 。 

其 实 有 许多 可 以 使 用 的 技术 ,但 我 们 没有 足够 篇 幅 来 详细 介绍 。 即 使 没有 
办 法 在 所 有 情况 下 提供 统计 分 析 的 正式 工具 ,但 在 某 种 形式 上 ,所 有 赋值 方法 
都 应 有 不 确定 性 的 估计 。 若 无 法 得 到 不 确定 性 ,一 个 包括 模糊 集合 技巧 的 分 析 
将 是 不 完整 的 。 我 们 将 着 重 说 明 两 个 案例 。 第 一 个 例子 使 用 的 是 敏感 性 测试 ， 
这 个 例子 用 的 是 4 个 度量 上 的 单一 判断 数值 组 合 而 成 的 测量 。 这 种 战略 是 有 用 
的 ,因为 它 可 以 被 运用 于 任何 情况 ,即使 是 单一 判断 得 到 的 直接 数值 也 行 。 第 
二 个 例子 是 在 把 录 得 的 附加 数值 投影 到 单位 区 间 之 内 时 ,用 自 举 抽样 法 对 归属 
赋值 逐 点 提供 误差 值 。 然 而 ,我 们 应 该 留意 的 是 ,任何 赋值 的 技巧 都 内 含 误差 。 
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如 果 我 们 使 用 一 个 多 元 指数 测量 模型 ,如 最 大 拟 似 因 子 分 析 或 者 多 重 项 目 反 应 
理论 的 技术 ,当然 就 可 以 对 赋予 数值 计算 出 信赖 区 间 , 这 个 数值 也 可 以 转换 成 
归属 值 的 信赖 区 间 。 就 算是 某 些 直接 诱导 方法 ,如 “回旋 梯 法 ”, 也 能 产生 不 确 
定性 估计 (Tversky & Koehler，1994) 。 


敏感 性 测试 


对 一 条 归属 函数 的 测量 提供 精确 性 的 方法 之 一 是 运用 敏感 性 测试 ,这 是 一 种 
实验 设计 ,用 来 显示 输入 时 的 干扰 为 结论 带 来 的 可 能 差异 (Saltelli, Tarantola &- 
Campolongo，2000)。 在 没有 其 他 不 确定 性 估计 的 来 源 ( 例 如 ,多 重 测量 或 者 包 
括 多 余 信息 的 数据 收集 策略 ) 时 ,这 种 方式 特别 有 用 。 如 果 归 属 值 有 某 种 来 源 ， 
比如 某 专业 判断 ,那么 ,敏感 度 测试 就 能 够 为 假设 使 用 这 些 评价 后 产生 多 少 不 
确定 性 提供 一 个 大 致 的 概念 。 我 们 将 着 重 讨论 一 个 专业 评价 下 的 归属 值 ,不 过 
这 并 非 此 技巧 唯一 的 运用 方式 。 相 对 于 多 种 指数 值 ,阐明 一 种 给 归属 赋值 的 指 
数 函 数 的 敏感 性 也 很 有 价值 。 

敏感 度 测 试 的 基本 构想 是 阐明 当 我 们 考虑 不 同 的 输入 方案 时 ,输入 某 个 特 
定 的 数值 将 会 对 结果 造成 多 大 变异 。 假 定 以 一 次 既定 评价 为 基准 ,一 个 评价 或 
许 系 统 性 地 偏 高 , 男 一 个 评价 或 许 系统 性 地 偏 低 。 在 接 下 来 的 应 用 案例 里 ,我 
们 不 会 有 这 些 评价 ,但 我 们 会 模拟 之 。 在 多 数 归 属 赋 值 的 任务 中 ,从 基准 来 看 
评价 误差 有 4 种 选项 :(1) 系 统 性 偏向 0( 严 苟 认定 );(2) 系 统 性 偏向 1( 宽 松 认 
定 );(3) 朝 两 个 终端 偏 误 (极端 认定 );(4) 朝 中 立 点 偏 误 (模糊 认定 )。 

Be 3.2 列 出 了 系统 性 修订 这 些 赋予 归属 值 的 4 种 偏 误 类 型 的 几 种 常见 的 转 
换 方 式 。 将 这 些 转 换 方式 应 用 到 基本 的 归属 赋值 ,我 们 就 可 以 用 标准 描述 统计 
来 产生 逐 点 的 柱状 误差 范围 。 但 必须 小 心 ,真正 的 评价 从 来 就 不 是 一 致 的 ,所 
以 有 些 随机 误差 是 正常 的 。 同 样 ,我 们 也 不 认为 表 3. 2 中 列 出 的 转换 方式 就 是 
必然 的 做 法 。 转 换 方式 必须 依据 特定 问题 来 打造 ,更 重要 的 是 ,作为 基准 的 评 
价 很 可 能 既 不 可 靠 也 不 有 效 , 所 以 ,敏感 度 测试 也 不 是 真正 研究 可 重复 性 的 蔡 
代 品 。 然 而 ,在 可 重复 性 不 存在 时 ,敏感 度 测 试 提 供 了 一 种 获得 不 确定 估计 的 
手段 。 
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案例 3. 2: 选 举 民 主 指数 的 敏感 性 分 析 
民主 程度 指数 数不胜数 (Munck & Verkuilen, 2002) ,其 中 之 一 一 一 选举 民 
主 指数 (Munck & Verkuilen, 2003; UNDP, 2004) , 正 是 以 模糊 集合 为 基础 的 。 
选举 民主 指数 是 一 个 从 4 个 成 分 得 到 的 组 合 指针 ,每 个 成 分 都 来 自 专业 评 
价 。 这 4 个 成 分 是 普选 权 (S)、 执 政权 (O)、 自 由 权 (F) 与 清廉 权 (C)。S 指 所 有 成 
人 都 有 投票 权 ,O 指 有 决策 权力 的 官员 (行政 与 立法 ) 都 必须 被 选举 ,下 指 组 织 政党 
竞争 与 结社 的 自由 ,C 指 计 票 公平 且 选 举 过 程 不 被 操纵 。 这 些 指标 的 赋值 是 由 一 组 
严格 界定 的 编码 规则 进行 的 。 我 们 将 在 第 6 章 讨论 这 些 成 分 如 何 组 成 前 述 指标 。 
为 了 让 终端 通过 转换 公式 趋 近 ,我 们 用 表 3. 2 E u = 0. 05 的 转换 公式 将 所 
有 评分 等 距 挤 压 进 [0. 025, 0. 975] 的 范围 内 ,完成 后 ,我 们 又 把 数值 扩张 回 
CO, 1], 此 时 ,任何 不 被 允许 的 数值 ,如 1.05 或 一 0. 1 ,都 被 裁减 进 此 范围 。 我 们 
也 用 表 3. 2 的 转换 公式 去 调整 所 有 成 分 的 基本 计 分 ,原来 是 根据 为 54 个 因素 分 
类 ,也 就 是 由 625 项 不 同 评价 的 组 成 转换 而 来 (其 中 之 一 是 基本 评价 )。 这 项 设 
计 是 将 依赖 不 同 成 分 且 各 有 不 同 偏 误 的 专家 评价 扩展 开 来 。 例 如 , 某 个 评价 可 
能 是 对 S 的 严 苛 认定 ,但 在 DO 方面 却 是 宽松 认定 ,并 且 下 与 C 只 适用 基本 评价 。 
我 们 用 定 序 统计 来 产生 柱状 误差 范围 。 图 3. 2 使 用 了 5% 与 95% 的 误差 ,显示 
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T 1960 年 .1977 年 .1985 年 以 及 1990 年 至 2002 年 间 , 巴 西 实际 选举 民主 指数 
值 的 可 能 范围 。 这 些 柱状 范围 包含 了 90% 的 模拟 数值 。 由 于 上 述 误差 范围 是 
根据 定 序 统计 而 来 ,与 平均 值 拥 有 标准 误 算出 的 置信 区 间 不 同 ,所 以 它们 并 非 


测试 转 位 与 自 举 抽样 


在 归属 程度 依据 样本 估计 而 来 (例如 ,分 位 点 转换 ) 的 情况 下 ,归属 函数 两 
侧 的 柱状 信赖 范围 是 可 以 估计 的 。 另 外 , 自 举 抽样 也 是 一 种 代替 品 (Efron & 
Tibshirani, 1994)。 自 举 抽样 是 从 原始 数据 库 中 抽出 替换 样本 ,并 且 可 以 随意 
重生 无 限 多 的 数据 库 。 然 后 ,新 的 分 位 点 与 标准 差 就 可 以 用 常见 的 统计 程序 来 
运算 。 无 论 用 哪 种 方式 ,把 归属 函数 当成 随机 变量 是 与 置信 区 间 取 向 相 容 的 。 

案例 3. 3: 模 糊 集合 “暴力 犯罪 倾向 ”命题 的 信任 带 

以 下 范例 是 根据 “全 美 逮捕 数据库 中 R 统计 软件 内 含 的 样本 所 计算 的 暴 
力 犯罪 统计 而 得 来 。 我 们 不 讨论 细节 ,但 鼓励 读者 尝试 自行 分 类 。 相 关 样 本 汇 
RT 1975 年 度 联邦 调查 局 (FBD) 收 集 的 美国 50 个 州 的 3 种 暴力 犯罪 一 一 谋杀 、 
强暴 与 伤害 一 一 的 逮捕 报告 数据 。 我 们 希望 创造 一 个 模糊 集合 , 称 之 为 “暴力 
犯罪 倾向 ”, 简 称 “VCP”。 

首先 ,我 们 定义 暴力 犯罪 指数 为 3 种 犯罪 率 (谋杀 ,强暴 与 伤害 ) 标 准 评分 的 
平均 数 。 我 们 认为 这 样 做 有 两 点 站 得 住 脚 。 第 一 ,虽然 谋杀 比 强暴 少 得 多 , 强 
暴 又 比 伤害 少 更 多 ,但 罪行 的 严重 性 使 得 它们 等 量 齐 观 仍 有 道理 。 我 们 调整 过 
原来 3 种 成 分 数值 之 变异 量 的 标准 评分 ,不 像 联邦 调查 局 的 未 加 权 犯 罪 指数 ,后 
者 仅 是 逮捕 数据 的 加 总 ,忽视 了 罪行 的 严重 性 ,结果 把 谋杀 跟 伤 害 混 在 一 起 。 
第 二 ,两 个 指数 的 相关 系数 是 0. 56 或 者 更 高 ,因此 ,依据 可 信和 度 理论 的 传统 ,我 
们 的 估计 方式 是 合理 的 。 暴 力 犯 罪 指数 的 平均 数 被 调整 为 0, 同时, 我们 将 标准 
差 标准 化 为 1。 我 们 用 方程 3. 3, 即 累积 分 布 函数 去 创造 归属 值 。 请 注意 ,由 于 
没有 真正 的 0 值 ,也 就 是 没有 无 暴力 犯罪 的 州 ,因此 ,这 个 赋值 会 创造 出 一 个 低 
于 常态 的 模糊 集合 (选择 一 个 更 低 的 截 点 就 可 以 使 集合 常态 化 ) 。 

为 了 获得 犯罪 统计 所 带 来 的 不 确定 性 ,我 们 用 两 种 不 同 的 技巧 ,一 种 是 根 
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图 3.3 反 向 Kolmogorov-Smirnov 测试 与 自 举 抽样 方法 之 误差 


据 经 典 统计 测试 , 另 一 种 是 根据 自 举 抽样 方法 。 首 先 ,我 们 用 反 向 Kolmogorov- 
Smirnov 测试 去 创造 累积 分 布 函数 的 柱状 置信 范围 (Conover，1980)。 这 种 测 
试 被 认为 缺乏 效率 ,并 且 能 创造 出 比较 宽 的 置信 区 间 。 其 次 ,我 们 从 50 个 原始 
数据 里 产生 1000 次 自 举 抽样 样本 ,每 个 样本 从 小 到 大 排序 ,50 个 州 的 归属 值 评 
分 为 g0. 025 5 q0. 975。 最 后 ,从 每 个 评分 的 集合 中 算出 一 个 累积 分 布 函 数 ， 
d0. 025 符 合 上 区 间 而 g0. 975 符合 下 区 间 。 

图 3. 3 显示 了 两 个 集合 的 置信 区 间 。 请 记 住 , 自 举 抽样 获得 的 信任 区 间 远 
小 于 反 向 K-S 测试 。 测 量 抽样 误差 对 后 续 分 析 的 影响 ,在 计算 过 程 中 将 取代 归 
属 值 上 下 两 端的 估计 并 且 曾 明 结论 将 如 何 变 化 。 


人 eo 


过 去 30 年 来 ,多 学 科 的 发 展 已 经 证 实 了 内 在 分 类 结构 分 析 的 潜能 。 从 20 
世纪 70 年 代 开 始 , 认 知心 理学 家 持续 认识 到 ,自然 认 知 的 分 类 拥有 复杂 的 内 在 结 
构 , 某 些 心理 学 家 对 心理 学 理论 的 范畴 提出 了 类 似 的 看 法 。 布 若 顿 (Broughton， 
1990) 认 为 ,模糊 集合 对 个 人 心理 学 研究 的 组 织 与 评估 ,尤其 是 对 个 人 评估 工具 与 
改进 异常 症状 很 有 用 。 赫 车 维 兹 与 马 卢 则 认为 “忧郁 ”应 该 被 当成 一 个 模糊 概 
念 (Horowitz & Malle, 1993) ,就 像 瓦 特 豪 斯 文 与 费 恩 (Waterhouse, Wing & 
Fein, 1989) 对 自 闭 症 以 及 薄 瑞 许 对 心力 交 痒 症 的 看 法 (Burisch，1993) 一 样 。 
此 外 ,社会 科学 家 也 开始 在 他 们 的 理论 与 研究 框架 里 持续 强调 分 类 的 复杂 性 与 
易 变性 。 例 如 , 拉 津 将 拉 扎 斯 菲尔德 对 “特质 空间 ”的 概念 加 以 概括 ,形成 了 多 
个 延伸 命题 (Lazarsfeld，1937), 从 原先 的 清晰 集合 推 向 了 模糊 集合 的 版 本 。 

由 于 清晰 集合 里 的 归属 程度 被 限定 在 0 与 1 之 间 ,我们 对 它们 的 内 在 结构 
也 就 无 可 置 喉 。 通 常 面 对 绝对 的 (成 员 数 量 ) 或 相对 的 (例如 ,与 其 他 集合 比较 ) 
集合 时 ,我 们 局 限于 讨论 集合 的 势 ( 规 模 ) 。 然 而 , 介 于 之 间 的 归属 程度 能 使 我 
们 对 分 类 结构 提出 许多 新 的 观点 并 加 以 分 析 甚 至 量化 。 这 些 观 点 可 以 与 社会 
科学 里 的 许多 有 用 的 概念 连结 起 来 。 在 这 一 章 中 ,我 们 将 从 对 模糊 集合 的 势 的 
简短 回顾 开始 ,然后 探讨 模糊 集合 的 概率 理论 ,最 后 阐明 如 何 测量 一 个 集合 的 
模糊 性 。 


集 势 :模糊 集合 的 总 量 


相对 于 清晰 集合 ,模糊 集合 的 集合 规模 或 势 的 概念 既 丰 富 又 有 问题 。 它 较 
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为 丰富 ,是 因为 如 我 们 将 讨论 的 ,我 们 将 使 用 多 种 集 势 ;问题 则 主要 出 在 对 归属 
规模 的 测量 方式 上 。 

数值 势 是 对 经 典 ( 清 晰 ) 集 合 的 一 种 概 化 。 对 一 个 可 量化 的 归属 比率 ( 即 无 
论 是 绝对 值 还 是 一 个 比值 ) 而 言 , 数 值 势 是 归属 程度 所 有 元 素 的 加 总 。 对 任何 
量化 的 变量 而 言 ,这 是 评价 的 加 总 。 然 而 ,与 多 数量 化 变量 相 比 ,对 集群 的 势 的 
解释 ,使 得 加 总 的 概念 与 集合 规模 的 关联 更 为 密切 。 对 数值 势 性 质 的 解说 将 澄 
清 这 一 点 。 我 们 令 |A| 代 表 A 集合 的 数值 势 ,将 之 定义 为 : 


| A |= Yima (Xi) [4. 1] 
i=l 


ma (Xi) 是 Xi 在 集合 A 内 获得 的 归属 程度 值 。 设 A 的 补 集 的 归属 值 
m~A(Xi) =1—ma(Xi), 根据 势 的 必然 性 ,|A| 就 服从 下 列 性 质 :(1) 对 任何 集 
合 A 或 集合 B 而 言 ,对 任何 一 个 事物 i, mp (Xi) 二 ma (Xi), 则 |1B| 二 |Al。 
(2) | 一 A|= NN 一 | A |。 也 就 是 说 ,A 的 集 势 与 其 补 集 加 起 来 是 N。(3) 对 任何 
集合 A 或 集合 B 而 言 , | AUBIHANBI=|A |+ B |。 也 就 是 说 ,两 个 集 
合 的 并 集 与 交集 的 势 加 起 来 ,等 于 两 个 集合 的 势 本 身 相 加 。(4) 对 任何 集合 A 
或 集合 B 而 言 ,数值 势 的 直 积 定义 为 | AXB|= >) ma(Xi)mp (Xi). FA HB 
在 统计 上 互相 独立 , 则 | AXB|=| A |x| B| (但 反之 不 成 立 )。 

数值 势 可 以 被 转换 成 比率 势 , 即 || A || =| A | /N。 其 性 质 与 概率 类 似 ,前 
三 条 规则 与 概率 的 性 质 相同 ,但 第 四 条 规则 缺乏 概率 的 反之 亦 然 特性 : (1)0 < 
|All <1. DRA i, 4B ma (Xi) = 0 时 ,上 Al = 0; 当 且 仅 当 
mA(Xi) = 1 if, | Al] = 1。 DÆX |A& Bil ==|AXB|/N 与 “条 件 ” 势 


1A1B1 = |A& Bl/ 中 B1 ,我 们 可 以 得 到 上 ~~A1BI 十 A1BI =1. 
(4) 若 A 与 B 在 统计 上 互相 独立 , 则 A&BI = |All x | Bll (但 反之 不 
成 立 )。 


然而 ,比例 数值 势 还 在 其 他 方面 与 概率 的 性 质 大 不 相同 。 例如, || A| Al] < 
1, 但 P(A|1A)==1; || A|~A]] 三 0, 但 P(A |~ A) = 0, 这 两 个 偏离 概率 的 
性 质 都 是 因为 中 介 归 属 值 未 必 互 斥 而 且 加 起 来 不 必然 等 于 1, 但 概率 必定 如 此 
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的 缘故 。 当 然 , 对 清晰 集合 来 说 , 比率 数值 势 就 等 于 概率 。 
等 距 层次 测量 的 集 势 


当归 属 值 不 是 一 个 绝对 值 或 者 比率 时 ,数值 势 就 会 出 现 很 大 的 问题 。 让 我 
们 先 从 没有 完全 归属 或 非 归属 基础 值 的 等 距 归属 值 为 例 来 说 明之 。 与 比较 任 
何等 距 数值 的 平均 数 一 样 ,我 们 仍然 可 以 比较 这 类 不 同 集合 的 “规模 *。 然 而 ， 
此 处 势 本 身 的 意义 就 不 清楚 了 ,因为 数值 势 的 性 质 (2) 与 性 质 (4) 及 比率 势 的 性 
质 (1) .性质 (3) 与 性 质 (4) ,并 不 符合 归属 值 线性 转换 的 规律 。 

然而 ,如 果 我 们 有 一 个 完全 归属 与 非 归属 的 区 间 值 ,这 多 数 性 质 就 可 以 被 等 
距 评价 所 克服 。 典 型 的 例子 是 , 当 我 们 用 一 个 截 点 来 决定 一 个 分 类 里 的 最 小 合格 
归属 值 ,而 该 分 类 的 等 距 评 价 也 有 一 个 上 限时 ,这 就 使 得 原先 的 数据 适用 于 线性 
过 滤 法 。 

Ay X, 为 非 归 属 值 的 区 间 值 而 Xy 为 完全 归属 的 区 间 值 , 若 对 任何 介 于 X， 
与 X/ 之 间 的 X 值 ,mA(X) 是 一 个 X 的 线性 函数 ,那么 ,我 们 就 可 以 定义 一 个 新 
的 归属 函数 并 且 获 得 | A | 值 : 

må (X) = (X — Xn) /(X¢ — Xn) (Xn <X < Xf) 
= 0(X <X,) [4.2] 


=1(X> Xy) 


所 以 ,如 前 所 述 ,我 们 可 以 得 到 || A || = SJ mx OO/N. 

案例 4. 1: 攻 击 性 行为 评分 

研究 者 抽取 了 89 个 8 岁 到 14 岁 儿 童 的 样本 与 被 介绍 到 精神 科 诊所 的 另 一 
群 儿 童 的 样本 ,对 其 儿童 行为 评价 表 (CBCL) 的 攻击 性 行为 分 项 评分 进行 比较 。 
CBCL 的 攻击 性 行为 评分 是 由 父母 亲 所 记录 的 过 去 6 个 月 内 ,儿童 产生 打架 、 争 
吵 与 其 他 类 似 行为 的 频率 ,其 数 域 在 0 到 40 之 间 , 这 个 评分 有 一 个 20 分 的 “就 
诊 底 线 ”。 

图 4. 1 的 上 图 呈现 的 是 线性 过 滤 的 过 程 。19 分 以 下 是 完全 非 归 属 的 底线 
截 点 (所 以 ,20 有 一 个 较 低 程度 的 归属 值 ) ,而 30 是 在 此 模糊 集合 里 “就 医 程度 
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攻击 性 ?完全 归属 的 截 点 。 图 4. 1 的 下 图 呈现 了 两 个 样本 的 CBCL 数值 。 


就 医 程度 攻击 性 
SOS SO SG © OS 
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CBCL 攻 击 性 行为 





CBCL 攻 击 性 
口 未 就 诊 国 介 绍 就 诊 
图 4.1 就 医 与 一 般 样本 之 CBCL 攻击 性 分 配 





我 们 使 用 20 的 就 诊 底 线 定义 “就 医 程度 攻击 性 ”的 清晰 集合 。 在 89 个 一 般 
样本 里 ,有 2 个 在 这 个 集合 内 ,而 被 介绍 就 诊 的 89 个 儿童 里 ,有 22 个 属于 这 个 
集合 。 另 一 方面 ,如 果 我 们 用 线性 过 滤 法 定义 这 个 模糊 集合 , 那 2 个 超过 就 诊 底 
线 但 没有 被 介绍 到 诊所 的 儿童 的 归属 值 就 不 是 0, 而 是 0. 09 与 0. 18, 集 势 只 有 
0. 27。 然而 ,被 介绍 就 医 的 群体 包括 高 攻击 性 的 儿童 , 集 势 高 达 11. 93。 这 两 个 


400 


| 社会 科学 中 的 数理 基础 及 应 用 


集 势 之 间 的 比值 是 44. 19(11. 93/0. 27) ,与 清晰 集合 运算 得 来 的 11(22/2) 相 去 
其 远 。 把 集合 内 “就 医 程度 攻击 性 ”儿童 的 归属 程度 纳入 计算 ,可 以 在 维持 个 数 
计算 的 概念 外 ,凸显 两 个 样本 之 间 更 真实 的 差异 。 


定 序 层次 测量 的 集 势 


等 距 层 级 取向 的 算法 可 运用 于 任何 包括 等 距 分 层 信息 的 潜在 变量 所 衍生 
出 来 的 定 序 评价 。 例 如 第 3 章 里 所 提 到 的 ,我 们 可 以 用 定 序 变 量 去 建构 Rasch 
评价 。 如 果 我 们 希望 将 这 个 评价 转换 成 对 应 的 归属 值 , 则 可 以 按照 前 述 方法 建 
立 数值 势 。 

即便 是 完全 定 序 的 评价 ,我 们 通常 仍 可 以 获得 关于 势 的 有 意义 的 命题 。 在 
任何 模糊 集合 中 ,最 模糊 的 差异 就 在 该 集合 的 非 归属 .可 能 归属 与 完全 归属 者 
之 间 。 可 能 归属 建立 了 集合 的 模糊 核心 。 例 如 ,一 组 数据 中 有 120 人 自称 是 “未 
吸烟 者 ”, 男 有 20 个 “已 戒烟 者 ”40 个 “尝试 戒烟 者 ”与 30 个 “吸烟 者 ”, 模 糊 核心 
就 是 20 十 40 = 60 个 人 ,吸烟 者 数目 的 下 限 与 上 限 分 别 是 30 与 20 十 40 十 30 = 
90 人 。 

如 果 我 们 将 模糊 核心 的 分 类 在 那些 较 偏 向 归属 与 较 偏向 非 归属 成 员 之 间 
作出 区 别 ,那么 会 使 得 集 势 的 上 下 线 缩小 。 假 设 我 们 决定 ,“ 已 戒烟 者 ”比较 接 
近 非 归属 成 员 (二 1/2), 而 “尝试 戒烟 者 ”比较 接近 归属 成 员 O 1/2), 则 吸烟 
者 的 下 线 与 上 线 就 会 变 成 50 人 (1/2 X40 十 30) 与 80 人 (1/2X20 十 40 十 30) 。 





模糊 集合 的 概率 分 布 


在 本 节 中 ,我 们 在 模糊 集合 在 因 变量 上 扮演 重要 角色 的 例子 上 运用 统计 学 
模型 的 概率 分 布 函数 (PDFs)。 我 们 把 重点 放 在 多 变量 分 析 技 术 可 行 的 那些 概 
率 分 布 函数 上 。 对 模糊 集合 来 说 ,一 般 化 的 概率 分 布 函数 是 ， 


f(m) = po AC) + pid) + 1 — po — pi)g(m) [4. 3] 
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po ARAB ABE. pi 是 完全 归属 者 的 概率 ,A(m) 是 在 单位 m 时 的 单位 脉 
冲 ,g(m) 是 一 个 密度 在 (0, 1) 区 间 之 内 连续 的 概率 分 布 函 数 。 当 完全 归属 与 非 
归属 本 身 很 重要 时 ,这 个 混合 的 分 布 可 以 导出 有 用 的 模糊 集合 统计 模型 ;即便 
当 两 者 不 重要 时 , 建 模 者 只 要 注意 单位 区 间 里 0 到 1 之 间 的 两 个 终端 即 可 。 很 
明显 , 正 态 之 类 预 设 的 假定 对 模糊 集合 来 说 无 法 成 立 。 最 可 行 的 出 路 包括 受 检 
分 布 截断 分 布 与 贝塔 分 布 。 

受 检 分 布 是 指 一 个 以 上 的 次 级 范围 的 密度 被 压缩 到 一 点 的 分 布 。 由 于 我 
们 缺乏 关于 研究 变量 的 知识 ,所 以 经 常 导致 受 检 分 布 (Long，1997:187)。 当 模 
糊 归属 函数 是 对 一 个 已 知 或 已 测 得 的 分 布 进行 过 滤 所 得 到 的 变量 ,其 结果 就 是 
受 检 分 布 。 例 如 ,有 一 个 平均 值 为 100 分 而 标准 差 为 15 分 的 常态 分 布 标准 智商 
测验 结果 ,如 果 我 们 定义 有 一 个 模糊 集合 的 群体 为 "具备 学 习 X 技能 潜质 ”, 这 
是 个 非 归属 底线 为 85 分 而 完全 归属 为 100 分 以 上 的 线性 过 滤 函 数 , 则 f(m) 就 
可 以 写成 下 式 : 


fm) 一 (0.1587)A(0) 十 (0.5)AG) + — po —pidd(m) [4.4] 


$(m) EA ASE AG PBL. H. m = max(0, min(1, (IQ—85)/15)), 这 个 概率 
分 布 函数 在 0 时 有 个 0. 1587 的 突起 ,而 在 1 那 端 则 是 0. 5 的 突起 ,0 与 1 之 间 的 
m 那 段 是正 态 的 概率 分 布 函数 。 

截断 分 布 由 部 分 概率 分 布 函数 导出 , 且 以 该 曲线 在 某 区 域 的 切割 内 再 常态 
化 之 后 构成 。 当 研究 者 处 理 一 个 集合 之 非 归 属 者 与 /或 完全 归属 者 被 排除 后 的 
次 群体 时 ,截断 分 布 可 以 运用 到 模糊 集合 的 样本 上 。 例 如 ,有 一 个 将 16 岁 以 下 
的 成 员 都 赋予 非 归 属 值 0 的 “年 轻 成 人 ”模糊 集合 ,这 个 模糊 集合 的 概率 分 布 函 
数 就 是 从 总 体 中 选 出 一 个 没 人 低 于 16 岁 的 样本 ,这 样 就 可 以 用 截断 分 布 来 给 因 
为 归属 值 为 0 而 被 截 的 数据 建 模 。 

在 多 重 线性 回归 里 ,为 受 检 或 截断 的 因 变 量 建 模 的 方式 已 经 发 展 成 完善 的 
模型 。 这 些 模 型 多 数 是 从 tobit 模型 变化 或 延伸 而 来 ,在 第 6 章 中 ,我 们 也 将 提 
供 一 个 运用 tobit 模型 的 例子 。 

最 后 ,对 模糊 集合 来 说 ,有 很 多 既 非 截断 , 亦 非 受 检 分 布 的 状况 。 如 果 研 究 
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者 想 把 单位 区 间 内 靠近 0 与 1 两 端 但 是 却 非 0 或 1 的 那些 数据 化 到 两 端 (以 避 
免 无 法 界定 的 切 分 点 ) ,贝塔 分 布 就 是 一 个 敏锐 且 有 弹性 的 候选 者 ,我 们 将 在 此 
简要 描述 贝塔 分 布 。 对 某 些 模糊 集合 ,我们 称 其 为 "Beta(w，r) 分 布 " 是 指 : 


fim) = m1 (1m) To 十 rzVXLTCo)TCr) J 


w、r>0 且 T(。) 指 的 是 伽 马 函 数 。w 与 r 两 者 都 是 造型 指数 ,其 中 ,w 把 密度 拉 
往 0 而 z 把 密度 都 拉 往 1。 贝 塔 家 族 包 括 很 广泛 的 造型 变化 ,单一 分 布 就 是 其 
中 一 个 特殊 的 例子 。 贝 塔 分 布 是 以 0. 5 为 中 心 对 称 性 的 ,也 就 是 fCm; ws t) = 
f(1 一 m; w, t), 因此 ,模糊 否定 完全 不 影响 这 个 分 布 。 为 了 与 其 他 区 间 定 义 的 那 
些 贝塔 分 布 作出 区 分 ,以 单位 区 间 来 定义 的 贝塔 分 布 通常 被 称 为 “标准 化 贝塔 ”。 

由 于 ww 与 t+ 是 很 难 诠释 的 造型 指数 ,所 以 贝塔 分 布 常用 的 指数 化 对 任何 意 
图 来 说 ,都 是 不 恰当 的 。 然 而 ,有 一 种 著名 的 ,将 w 与 + 转换 成 定位 与 离散 指数 
的 再 指数 化 ,使 得 多 变量 一 般 线 性 模型 可 以 用 来 估计 有 定位 与 离散 数值 的 贝塔 
分 布 因 变 量 (Paolino，2001) 。 对 这 些 模型 的 批注 已 经 超过 了 本 书 的 范围 ,但 我 
们 必须 清楚 ,多 元 一 般 线性 模型 技巧 对 贝塔 分 布 之 模糊 集合 应 变量 的 运用 是 可 
能 的 。 


定义 与 测量 模糊 性 


广泛 地 说 ,一 个 模糊 集合 之 所 以 较 模糊 ,是 因为 很 多 案例 里 有 中 间 的 归属 
值 ,而 之 所 以 较 不 模糊 , 则 是 因为 有 很 多 属于 0 与 1 的 归属 值 。 标 准 的 模糊 集合 
理论 对 模糊 性 的 定义 是 说 一 个 集合 最 模糊 时 , 其 中 所 有 元 素 的 归属 值 都 等 于 
1/2, 而 一 个 集合 完全 清晰 时 ,其 中 所 有 元 素 的 归属 值 非 0 即 1。 在 社会 科学 里 ， 
模糊 性 可 以 与 下 列 概念 相关 :两 极 化 共识 、 相 对 变异 性 、 分 类 法 、 集 中 化 以 及 不 
平等 。 企 图 建构 这 些 特 质 的 测量 方式 的 相关 文献 已 经 运用 了 模糊 性 的 测量 ,并 
且 这 些 对 如 何 测量 模糊 性 的 讨论 也 丰富 了 理论 性 的 争论 。 因 此 ,在 许多 学 科 
中 ,对 模糊 性 的 测量 观点 常 与 重要 的 概念 相关 ,而 研究 者 也 常常 发 现 模糊 测量 
的 用 处 很 大 。 
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在 此 ,视觉 模拟 可 能 对 我 们 有 所 帮助 。 在 固定 光源 时 ,如 果 使 用 黑白 像素 ， 
相片 的 对 比 是 最 大 的 ;而 灰 阶 像素 与 中 间 渐 层 是 最 模糊 的 。 模 糊 性 就 是 对 比 的 
反面 。 如 果 用 概率 分 布 函数 的 传统 认 知 来 理解 模糊 性 ,一 个 最 清晰 集合 的 归属 
值 的 概率 分 布 函数 将 会 出 现在 0 与 1 两 端的 双 峰 ,而 最 模糊 集合 的 归属 值 概率 
分 布 函数 将 会 出 现在 1/2 的 单 峰 曲线 。 

模糊 性 集合 A 的 测量 fuz (4) 的 标准 如 下 (De Luca & Termin, 1972); 
(1) fuz(A) ==0, 当 上 且 仅 当 对 所 有 XX, ma (X) = 0 或 1。(2) fuz (A) = 最 大 值 , 当 
上 且 仅 当 对 所 有 X, ma XO) = 1/2, (3) fuz(A) < fuz(B), 对 所 有 XX, 当 ms(X) < 
1/2 时 ,mA(X) 和 mp(X); 当 mB(X) > 1/2 时 ,ma(X) > mp(X), (4) fuz(A) 
= fuz(~ A). . 

在 模糊 集合 文献 中 ,已 经 有 研究 者 提出 好 几 种 模糊 性 的 测量 方式 ,在 史 密 
生 的 作品 里 有 过 描述 与 比较 (Smithson，1987、1994) 。 以 集 势 来 说 ,我 们 在 何 
种 程度 上 能 够 有 效 量 化 模糊 性 取决 于 对 归属 评价 的 测量 程度 。 就 如 我 们 已 知 
的 ,模糊 集合 文献 的 弱点 之 一 是 ,其 往往 假设 归属 评价 是 一 个 绝对 值 ( 或 者 至 少 
是 个 比率 ) ,这 也 反映 在 已 经 被 发 展 出 来 的 模糊 性 测量 上 。 我 们 将 简单 介绍 模 
糊 集合 文献 里 常用 的 模糊 性 测量 ,然后 探讨 对 社会 科学 数据 来 说 ,更 普遍 有 用 
的 另 一 种 方法 。 

最 简单 的 模糊 性 测量 是 由 考 夫 曼 (Kaufmann，1975) 提出 并 被 史 密 生 
(Smithson，1987:112) 以 样本 规模 加 以 标准 化 的 : 


FK = (1/NH) >} | mai — mA; | [4.5] 


4 mai 是 集合 A 里 第 i 个 元 素 的 归属 值 时 , ma; = 1, SHANK ma > 1/2 A 
mă; 二 0 时。 此 外 ,NN 是 样本 规模 , 且 H = 1/2 是 上 述 加 总 的 极 大 可 能 值 ( 当 对 
所 有 i 来 说 , ma; = 1/2 时 , 则 该 集合 模糊 性 是 最 大 的 )。 这 个 系数 就 是 以 第 i 个 
归属 值 与 其 最 “不 模糊 ”的 邻近 断裂 归属 值 0 或 1 的 对 应 点 之 间 差 异 的 平均 绝对 
值 ,去 除 以 最 大 可 能 差异 。 因 此 , 它 测量 的 是 模糊 集合 与 可 能 最 接近 的 清晰 集 
合 之 间 的 差异 ,如 果 两 者 没 差异 ,当然 模糊 集合 也 就 不 模糊 了 ,那么 FK = 0。 
在 模糊 性 与 缺乏 对 比 之 间 的 指数 建议 我 们 用 一 个 集合 与 其 补 集 的 归属 值 
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之 比较 来 测量 模糊 性 。 最 近 模 糊 性 系数 的 其 中 之 一 正 是 如 此 (De Luca & 
Termini, 1972; Smithson, 1987:112): 


FD = (1/NH) >} [> ma; |n(mai ) 一 (l—ma;)Ind—ma;)] [46] 


4 H =—I|n(1/2) 时 ,加 总 值 将 达到 最 大 。 该 式 测量 了 模糊 归属 值 里 不 确定 信 
息 的 量 。 这 个 二 进 制 的 模糊 性 测量 与 信息 理论 对 平均 信息 量 的 测定 有 关 。 当 
所 有 ma 非 0 即 1 时 , FD = 0; 47 BA mai 1/2, FD = 1, 

最 后 ,模糊 性 与 不 平等 的 关联 使 得 史 密 生 建 议 模糊 性 的 测量 可 以 为 与 平均 
值 相 比 的 相对 变异 性 奠基 ,其 主要 的 灵感 来 自 当 所 有 成 员 归 属 值 都 是 相同 程度 
时 ,无 论 其 数值 是 否 为 1/2 或 任何 其 他 数值 ,模糊 集合 都 无 法 区 别 其 内 在 元 素 。 
相反 ,车 归属 值 被 限定 为 0 与 1, 则 对 所 有 给 定 的 平均 值 来 说 ,此 时 变异 数 都 是 
最 大 的 。 因 此 ,模糊 性 与 变异 数 成 反比 。 当 然 , 并 非 所 有 使 用 模糊 集合 的 研究 
者 都 同意 这 个 论点 ,他 们 也 可 能 坚持 用 1/2 作为 固定 的 指标 。 

有 研究 者 为 相对 变异 数 测量 的 观点 界定 了 两 个 使 用 时 须 满 足 的 先决 条 件 。 
首先 ,它们 在 向 量 相 乘 时 应 该 保持 一 致 (适用 于 比率 评价 的 变量 )。 第 二 ,它们 
应 该 “对 转换 敏感 即 当 某 些 数值 从 较 低 价值 的 元 素 转换 而 来 又 与 较 高 价值 的 
元 素 相 加 时 ,性质 较 佳 (Allison，1978) 。 基 尼 系 数 、 变 异 系数 与 信息 理论 变异 系 
数 都 满足 上 述 条 件 。 史 密生 (1982b、1987:113 一 116) 论 证 ,这 些 系数 应 该 以 可 
达到 的 极 大 值 来 加 以 标准 化 。 

相对 变异 测量 在 向 量 祖 乘 时 是 一 致 的 ,而 公式 4. 5 与 公式 4. 6 所 呈现 的 模 
糊 测量 也 可 能 被 一 般 化 而 在 特定 条 件 下 处 理 比率 评价 。 不 幸 的 是 ,其 中 没有 一 
个 适用 于 等 距 与 定 序 的 归属 评价 。 然 而 , 某 些 简单 的 技巧 使 我 们 得 以 测量 这 类 
评价 的 模糊 性 。 


模糊 性 的 累积 分 布 取向 


我 们 介绍 测量 模糊 性 的 方法 或 许可 以 运用 于 任何 归属 值 ,只 需 区 分 非 归 属 
者 .近乎 非 归 属 者 .近乎 完全 归属 者 以 及 完全 归属 者 即 可 。 就 像 早先 比较 集合 
规模 的 分 析 , 这 个 取向 几乎 可 以 广泛 运用 于 各 种 评价 方式 。 
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根据 考 夫 曼 (Kaufmann，1975) 的 建议 ,实证 上 的 累积 分 布 函数 可 以 与 最 清 
晰 集合 的 累积 分 布 函 数 比较 ,以 提供 模糊 性 的 一 种 指标 。 这 两 个 累积 分 布 函 
数 越 是 相似 ,集合 的 模糊 性 就 越 少 。 通 过 累积 分 布 函 数 的 运用 ,我 们 避免 了 
必须 将 归属 程度 量化 的 那 一 步 ,所 以 就 可 以 把 这 个 方法 运用 到 定 序 的 归属 评 
价 上 。 
现在 ,我 们 需要 的 是 一 个 比较 实证 累积 分 布 函数 与 最 清晰 集合 的 累积 分 布 
函数 差异 程度 的 测量 方式 。 有 好 几 种 方法 ,但 为 顾及 简化 与 运用 的 广泛 程度 ， 
我 们 就 使 用 Kolmogorov 拟 合 度 统计 (Conover, 1980; D'Agostino & Stephens, 
1986)。 令 Fma: ) 代 表 一 个 样本 里 归属 值 实证 上 的 累积 分 布 函 数 ,F(Cai RE 
最 清晰 集合 的 累积 分 布 函数 , 则 Kolmogorov 拟 合 度 就 是 (mai ) 与 F(CAi) 之 
间 差 异 的 最 大 绝对 值 : 
T(A) = sup; | FQma;) — F(Ca; ) | [4.7] 


S :代表 原来 评价 非 归 属 者 的 截取 值 ,h 代表 在 近乎 非 归 属 者 之 下 但 是 在 近乎 
归属 者 之 上 的 中 间 范 围 评价 ,6b 代表 完全 归属 者 的 截取 值 。 由 于 FCCa; ) 是 个 梯 
级 函数 : 


F(Cai) = FD OTSA ma < 完全 归属 者 而 言 ) 
= 1( 对 所 有 ma = 完全 归属 者 而 言 ) [4. 8] 


T(A) 不 是 在 s 发 生 ,就 是 在 6 发 生 。 因 此 ,TC(A) 仪 依赖 于 累积 分 布 函 数 中 s, h 
与 0 的 数值 。 

S F(s) 为 仅 包括 非 归属 者 的 实证 累积 分 布 函数 的 数值 , 令 (4h) 为 包括 
以 下 非 归 属 与 中 间 归 属 者 的 累积 分 布 函 数 数值 ,而 下 (0) 为 除了 完全 归属 者 以 
外 ,所 有 个 案 的 累积 分 布 函数 数值 , 则 有 : 


T(A) = max[ F(h) — F(s), F(b) — F(h) ] = maxl Psn, Pha] [4.9] 
Pa 是 中 间 归 属 个 案 较 接近 非 归 属 者 的 比例 ,Pu 则 是 中 间 归 属 个 案 较 接近 完全 


归属 者 的 比例 。 
图 4. 2 显示 了 这 个 图 像 。 从 T(A) 的 基础 来 说 ,可 以 被 视 为 一 个 由 FCmai) 
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与 F(Cai; ) 之 间 比 较 得 来 的 4 类 概率 分 布 函数 ,图 的 上 半 部 分 显示 了 非 归属 者 
Cro) .中间 归属 者 (rw o mw) 与 完全 归属 者 的 比例 (xi )。 上 归属 程度 的 截 点 (5、A 
与 5) 在 图 上 用 不 同比 例 个 案 与 其 邻近 类 型 的 边界 来 表示 。 





Tsh | Nhi | mı | 














l~i Tsh | Thb | 








图 4.2 T(4) 的 累积 分 布 函数 基础 


很 清楚 , 若 T(A) = 0, 则 A 是 清晰 集合 。T(A) 有 极 大 值 为 1, 包 括 累 积分 
布 函数 完全 集中 于 一 点 或 者 在 非 归属 者 与 完全 归属 者 之 间 的 范围 。 这 与 史 密 
生 所 定义 的 最 大 模糊 性 相应 (Smithson，1982a) 。 同 样 , TA) = T(~ A). 最 
ja Mt BPA X24 A124 mp (X) 二 1/2 时 ,ma (X) <mp(X) ,或 当 mB(CX) > 1/2 
H ma (X) > mp(X) Kt, M TCA) < TB). 因此 ,T(A) 满 足 了 模糊 性 测量 的 4 
个 必要 性 质 。 

如 之 前 提 到 的 ,这 个 对 模糊 性 的 测量 几乎 可 广泛 运用 于 各 种 评价 方式 。 对 
任何 两 个 归属 值 的 评价 ,只 要 有 非 归 属 者 、 完 全 归属 者 的 条 件 ,再 加 上 中 介 归 属 
值 是 比较 接近 非 归 属 者 或 完全 归属 者 的 判断 , 则 它们 的 T(A) 值 就 可 以 不 需 顾 
虑 任何 评价 程度 的 测量 性 质 而 直接 进行 比较 。 

案例 4.2: 贝 民 忧郁 量 表 

贝 氏 忧郁 量 表 II(BDI-ID (Beck & Steer, 1996) 是 一 个 有 21 个 项 目的 测量 
忧郁 程度 的 工具 ,其 区 间 从 0 分 到 63 分 ,用 来 作为 忧郁 程度 参考 的 截 点 如 下 :0 
到 13 为 最 小 .14 到 19 为 轻微 .20 到 28 为 中 度 、29 到 63 为 严重 。 我 们 设 定 s = 
13.5, b= 15.5, b= 26,5, 

假设 我 们 有 128 个 受 测 者 的 BDIII 评分 ,我 们 用 数值 s h 与 6 比较 了 
下 (ms ) 与 下 (Ca ) ,就 像 在 图 4. 3 中 所 显示 的 ,其 结果 是 : 
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累积 分 布 函 数 
口 口 口 口 口 口 口 口 口 口 口 避 一 
x 
2 
S 


-4005-4 8 12 16 20 24 28 32 36 40 44 48 52 56 60 64 


BDI-II 数值 


图 4.3 F(my)5 F(Ca ) 的 贝 氏 忧郁 量 表 U( BDI) WH 
F(s) = 59/128 = 0. 461, F(h) = 92/128 
= 0.719, F(b) = 110/128 = 0. 859 


因此 ,我 们 得 到 : 


po = 59/128 = 0.461, psh = F(h)—F(s) = (92 —59)/128 = 0. 258, 





pw = F(b) — F(s) = (110 — 92)/128 = 0. 141 
H pi = (128 — 110)/128 = 0. 141 
T(A) 的 样本 测量 为 : 


T(A) = max[ psn > pw | = max(0. 258, 0. 141) = 0. 258 


T(A) 信 任 区 间 与 显著 性 测试 


运用 图 4.2 上 半 段 里 第 二 行 的 三 分 类 表 来 重新 安置 概率 分 布 函数 ,我 们 可 
以 得 到 T(A) 的 置信 区 间 与 显著 性 检验 。 这 一 格 区 分 了 完全 归属 / 非 归 属 的 清 
晰 个 案 与 中 间 归 属 值 的 模糊 个 案 。 集 合 的 模糊 核心 部 分 的 规模 等 于 中 间 归 属 
格子 的 加 总 ,rp = Tsh F Thb o 


408 


| 社会 科学 中 的 数理 基础 及 应 用 


开始 时 ,我们 可 得 到 一 个 x;s 的 置信 区 间 (CI) ,模糊 核心 的 规模 以 常见 的 比 
例 形式 ,可 能 是 精确 或 趋 近 的 数值 。 此 外 ,多 向 频率 分 析 的 传统 方法 也 可 以 应 
用 于 比较 不 同 集合 之 模糊 核心 的 规模 ,或 是 跨 集合 数据 的 建 模 。 我 们 定义 rp 
的 置信 区 间 为 LxssL » mou le 

同样 ,我 们 也 可 以 获得 xz 及 zs 平行 独立 的 (1 一 a)%*100% 置信 区 间 。 然 
后 ,我 们 又 可 以 定义 T(A) 的 (1 一 a)100% 置信 区 间 。 其 下 限 是 : 


NshL (AL /sbL > 1/2) 
TOL (TOL /nsoL 21/2) [4. 10] 
noL /2( 其 他 情况 下 ) 

其 上 限 是 : 


TshU (AshU /nsbU 之 1/2) 
menbU Crenbu / meso => 1/2) 
max《xwU，1 一 xshL ) CEL F) 
案例 4.3: 贝 氏 忧 郁 量 表 ( 续 ) 
回顾 案例 4.2, ps = 0. 258 与 pw = 0.141, 所 以 测量 样本 得 到 TCA) = 
maxl psn» Pro] = 0.258。 从 模糊 集合 开始 ,我 们 有 po = (33 + 18)/128 = 
0. 398, H. xsw 的 97.5% 的 置信 区 间 应 为 [0. 3071, 0. 4975], msn 的 97.5%% 的 置信 
区 间 是 [0. 1815, 0. 3525] ,与 xw 的 97.5% 的 置信 区 间 是 [0. 0853, 0. 2231]。 从 
公式 4. 8 可 知 ,T(A) 的 置信 区 间 下 限 是 0. 1815, 上 限 是 0. 3525。 当 下 限 与 0 显 
著 不 同时 ,上 限 表 明 ,这 个 集合 是 最 温和 的 模糊 。 


本 


交集 、 并 集 与 包含 


本 章 重点 讨论 模糊 集合 理论 所 提出 的 3 种 争议 性 的 特殊 元 素 关系 ,这 些 关 
系 对 双 变 量 关 系 (例如 ,相关 系数 或 发 生 比 率 ) 的 家 族 来 说 是 陌生 的 成 员 。 这 三 
者 就 是 模糊 交集 、 并 集 与 包含 。 就 像 第 2 章 里 解释 过 ,在 模糊 集合 A 与 集合 
的 交集 与 并 集 里 ,评价 归属 值 zx 的 传统 规则 是 : 


mANB (ZX) = min(ma (x), mB (x)) 


mAUB(ZX) = max(mA (x), mB(x)) [5.1] 
此 外 ,从 模糊 集合 A 包含 模糊 集合 B(A DB 导出 的 规则 是 对 所 有 xz MA, 
mA (x) 之 72B( 工 ) [5. 2] 


与 相 加 不 同 ,交集 与 并 集 的 运算 不 是 互补 性 的 ,但 相 加 却 是 。 例 如 ,对 公式 
5. 1 来 说 ,对 于 任何 一 个 zx, 我 们 可 以 看 到 A N B 的 归属 值 mwans (zx) 里 ,A 集合 
里 一 个 高 归属 程度 的 ma (xz) 并 不 会 与 BB 集合 里 较 低 归属 值 的 mB(z) 相 加 。 包 
含 的 概念 也 跟 相关 系数 不 同 ,这 同时 由 前 者 非 对 称 的 性 质 ( 即 A 包括 B 的 程度 
无 法 告诉 我 们 B 包括 A 的 程度 ) 以 及 必要 与 充分 的 逻辑 概念 在 其 中 的 直接 关系 
而 造成 。 

就 像 第 3 章 里 提 到 的 ,评估 交集 、 并 集 与 包含 的 必要 条 件 之 一 就 是 性 质 评价 
(例如 ,日 本 是 “亚洲 国家 ”相对 于 “资本 主义 经 济 体 ”, 是 否 有 更 高 的 归属 程度 )， 
因此 , 当 我 们 处 理 模糊 交集 或 者 包含 的 评价 技巧 时 ,应 该 不 只 是 留意 测量 的 程 
度 , 也 要 注意 性 质 评价 。 然 而 ,在 这 一 节余 下 的 部 分 中 ,我们 将 讨论 可 以 合理 假 
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设 两 个 性 质 评价 的 明显 案例 。 史 密生 讨论 了 更 多 例子 的 细节 (Smithson， 
2005). 

案例 5. 1: 对 移民 的 态度 

模糊 集合 包含 是 清晰 集合 包含 的 一 般 化 ,虽然 公式 5. 2 很 少 完全 满足 ,但 在 
很 高 程度 时 可 以 找到 真正 的 例子 。 图 5. 1 显示 了 这 个 例子 ,在 84 个 澳大利亚 国 
立 大 学 二 年 级 的 心理 系 学 生 中 , 受 访 者 对 下 列 命题 A 一 “澳大利亚 应 该 容许 移 
民 进 入 ”以 及 B 二 “应 该 允许 船民 进入 澳大利亚 并 且 批 准 他 们 的 要 求 ” 评 分 ,在 
AD B 的 关系 中 只 有 3 个 例外 ,显示 在 图 的 右上 方 。 

这 个 例子 显示 了 交集 .并 集 与 包含 的 重大 关联 。 若 A 字 B, 则 An 如 等 于 
最 小 集合 A 或 集合 B, 晶 A U B 等 于 两 个 之 中 的 最 大 集合 。 在 图 5. 1 中 ,我们 
可 以 看 到 , AN B 的 归属 赋值 将 是 manB(z) = mgle), RT ma) = 148 
ma (x) = 5/6 的 3 个 个 案 是 例外 。 此 外 ,我 们 也 可 以 看 到 除了 前 述 3 个 例外 ， 
A U B Æma U B) = ma œ), JARI mane (x) 的 分 配 越 是 接近 A 或 B 的 最 
小 值 ,A 与 B 之 间 的 关系 就 越 接 近 于 真正 的 包含 关系 ,归属 值 maus) 的 分 配 
与 A 或 B 的 最 大 值 之 间 的 关系 亦 然 。 当 然 , 交 集 与 并 集 的 计算 必须 依赖 性 质 评 
价 , 如 果 没 有 充分 的 理由 ,简单 地 假设 性 质 评价 可 以 维持 的 做 法 并 不 理智 。 我 
们 认为 ,此 处 尚 可 接受 是 因为 每 个 项 目的 响应 评价 与 项 目 本 身 的 形式 是 一 
致 的 。 




















自 1 3 if 
T 

R 5/6 6 5 
E 

< 4/6 6 6 

3a 

= 3/6 2 1 3 5 
He 

E 2/6 2 8 8 F 2 
R 

Bl 1/6 1 1 4 1 2 


0 1 3 2 2 3 2 1 





0 1/6 2/6 3/6 4/6 5/6 1 
人 A 二 澳大利亚 应 该 允许 移民 进入 
图 5.1 模糊 集合 包含 的 例子 
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图 5. 1 的 例子 同样 强调 了 模糊 包含 与 必要 性 及 充分 性 的 逻辑 观念 之 间 的 关 
联 。 图 5. 1 上 的 位 图 呈现 了 一 个 预测 性 的 解释 是 ,集合 A 中 较 高 的 归属 值 对 集 
合 B 中 较 高 的 归属 值 的 预测 ,是 必要 但 不 充分 的 ,反之 ,集合 B 中 高 的 归属 值 对 
集合 A 中 较 高 的 归属 值 的 预测 ,是 充分 但 不 必要 的 。 这 些 不 对 称 的 逻辑 或 预测 
关系 不 可 能 由 对 称 的 关联 性 测量 ,例如 由 相关 系数 来 获得 。 对 于 图 5. 1 显示 的 
趋势 用 相关 系数 0. 299 来 解释 ,当然 会 错失 这 些 重 点 ,即使 指出 其 中 有 蜡 方差 性 
也 于 事 无 补 。 

最 后 ,值得 一 提 的 是 包含 ,必要 性 与 充分 性 是 一 个 更 广泛 且 有 用 的 关系 ,是 
模糊 限制 中 的 特殊 化 的 例子 。 对 图 5. 1 的 第 三 种 解释 是 ,A 与 B 的 共同 分 布 几 
乎 直接 满足 不 等 式 ma (zx) 一 mp (x) 过 0。 模糊 限制 是 这 类 不 等 式 的 一 般 化 。 

案例 5. 2: 揭 露 或 限制 信息 的 决策 

在 一 个 职业 调查 中 (Bopping，2003) ,有 229 个 受 访 者 被 告知 一 个 揭露 或 限 
制 由 其 同事 提供 的 信息 的 困境 , 受 访 者 在 两 个 方面 给 下 列 问题 进行 评分 : 


1 二 “提供 信息 给 其 他 人 是 重要 的 ” 
T= 二 “维持 保密 的 信任 关系 是 重要 的 ” 


我 们 展示 模糊 集合 的 运用 方式 来 探讨 受 访 者 对 工 或 工 或 两 者 给 予 高 分 的 假设 。 

这 里 的 假设 可 以 被 解释 成 模糊 并 集 TU 工 强 烈 偏 向 1。 更 “强烈 ”的 版 本 预测 
TD~ I (GE TD ~ T), Bb mi (a2) > 1 — mr (a), 同样 的 模糊 限制 是 m1(x) 十 
mr (x) > 1, 这 个 评价 对 了 与 有 重要 的 反应 模式 ,出 于 呈现 的 目的 ,我 们 假设 
性 质 评价 的 问题 已 经 被 解决 了 。 表 5. 1 的 上 半 部 分 呈现 了 这 个 假设 的 强烈 版 
本 ,其 中 除了 9 个 个 案 之 外 ,都 符合 命题 。 

假设 了 与 了 彼此 独立 ( 表 5. 1 的 下 半 部 分 ), 对 已 观察 到 的 工 U 工分 布 与 其 
期 望 值 的 比较 表明 ,两 者 应 该 比 实际 观察 到 的 更 强烈 偏向 负面 。 卡 方 检验 或 许 
可 以 用 来 比较 两 个 分 布 , 且 平方 标准 残 差 建构 的 卡 方 统计 呈现 在 倒数 第 三 行 上 。 
这 个 卡 方 检 定 得 到 从 (6) = 13. 2, p = 0.04, 因此 支持 偏向 的 假设 。 与 案例 5. 1 
的 状况 一 样 , 这 里 双 变量 的 假设 检验 用 通常 的 概念 与 相关 测量 会 很 难 评价 ,但 
是 用 模糊 集合 却 能 轻松 掌握 。 
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#5.1 I 与 7 的 交叉 分 析 表 








1 9 4 5 8 4 6 23 59 

5/6 8 9 7 u 22 5 62 

4/6 2 14 4 15 1 36 

3/6 1 7 6 10 9 33 

2/6 1 1 4 8 3 17 

人 1/6 1 1 5 4 11 
0 1 1 9 11 

合计 10 16 30 22 31 66 54 229 

IUT 





0 1/6 2/6 3/6 4/6 5/6 1 合计 








观察 到 的 几率 密度 函数 1 1 2 8 32 95 9%0 229 
预期 几率 密度 函数 0.48 2.02 7.04 15 26.9 78.5 99.1 229 
平方 标准 残 差 0.56 0.51 3.61 3.26 0.97 3.47 0.83 13.2 
侦 测 与 评估 模糊 包含 


侦 测 与 评估 模糊 包含 的 工作 引发 了 3 个 问题 。 第 一 ,我 们 如 何 得 知 在 什么 
程度 上 满足 模糊 包含 的 规则 ma (zx) > mp (a)? 其 次 ,我 们 如 何 从 两 个 独立 的 偏 
向 变量 的 二 元 分 布 的 “ 伪 版 ”里 区 分 出 真正 的 模糊 包含 ? 第 三 , 何 时 可 以 在 我 们 
的 研究 发 现 里 排除 对 立 的 解释 并 且 肯 定 模糊 集合 的 解释 ? 

从 第 一 个 问题 开始 ,许多 模糊 集合 理论 家 (Dubois & Prade，1980:22) 批 
FEX ma (x) > mp (x) 的 规则 太 过 僵硬 ,不 够 模糊 。 史 密生 回顾 过 另类 的 评估 
模糊 包含 的 方案 (Smithson，1987:31 一 32、101 一 104) ,并 发 现 它 们 属于 两 大 
类 ,第 一 个 方案 是 将 ma (x) > mp (zx) 的 规则 模糊 化 (Dubois & Prade, 1980; 
Ragin 2000) ,第 二 个 方案 是 建构 一 个 基于 模糊 集合 运算 公式 或 其 他 适当 概念 
的 包含 程度 指数 。 两 个 方案 都 基于 归属 评价 所 拥有 的 测量 程度 。 我 们 稍 后 
将 讨论 这 个 议题 。 这 里 ,我 们 先 转向 区 分 伪 版 与 正版 包含 的 议题 ,来 决定 二 


元 分 布 是 用 一 些 其 他 的 相关 性 来 解释 ,还 是 用 包含 来 解释 比较 好 。 表 5. 2 
用 3 个 伪 版 (第 一 、 第 三 与 第 四 张 表 ) 与 一 个 正版 包含 关系 (第 二 张 表 ) 来 显示 
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重点 。 
表 5.2 包含 关系 与 伪 版 
独立 十 偏向 

追 求 
不 逃避 0 ms(2) m3) m(4) m5) m,(6) 1 合计 
0 4 1 1 0 0 10 
mya (2) 5 2 1 1 0 15 
mna (3) 6 2 1 1 0 17 
mna (4) 7 5 3 2 20 
mna (5) 20 13 8 6 55 
mna (6) 33 23 12 10 91 
1 55 38 21 17 152 
合 it 130 90 50 40 360 

包含 关系 

追 求 
不 逃避 0 m(2) m3) m(4) m(5) m,(6) 1 合计 
1 1 0 16 
0 0 0 17 
1 0 0 46 
6 0 1 83 
3 2 0 52 
19 9 | 1 70 
1 3 3 2 16 13 13 26 76 
x Jf 55 44 58 107 43 25 28 360 
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续 表 
正 相 关 
iB ok 
不 逃避 0 m (2) mB) m(4) as(5) m(6) 1 合计 
0 | 47 | 0 0 0 0 0 0 47 
mna (2) 0 | 47 5 0 0 0 0 52 
mna (3) 0 0 47 10 4 0 0 61 
mna (4) 0 0 0 45 10 0 0 55 
mna (5) 0 0 0 0 46 5 0 51 
mna (6) 0 0 0 0 0 47 0 47 
1 0 0 0 0 0 0 47 47 
合 计 47 47 52 55 60 52 47 360 
负 相 关 
i 求 
不 逃避 0 ms(2) mB) m4) m5) m,(6) 1 合计 
0 16 16 
mva (2) 4 4 
mna (3) 14 14 
mna (4) 87 87 
mna (5) 92 92 
mna (6) 92 92 
1 55 55 
& tH 55 92 92 87 14 4 16 360 


案例 5. 3: 现 实 的 追求 /逃避 职位 案例 

第 二 张 表 是 从 真实 数据 中 获得 的 (Smithson & Heketh，1998) , 亦 即 360 个 
受 访 者 对 荷兰 职业 兴趣 量 表 的 双 项 响应 。 一 项 响应 显示 在 何 种 程度 上 ,他 们 会 
追求 某 个 具有 “具体 的 ?工作 任务 的 职位 , 另 一 项 响应 则 显示 在 何 种 程度 上 ,他 
们 会 逃避 该 项 工作 。 两 个 变量 都 是 对 等 定义 的 (范围 从 完全 不 会 到 非常 强烈 )， 
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而 且 “ 逃 避 ” 评 分 也 被 反 向 录入 为 “不 逃避 ”的 评分 。 假 设 上 的 关系 是 ,追求 某 项 
工作 应 该 充分 非 必要 地 影响 不 逃避 该 项 工作 ,这 是 因为 某 人 可 能 因为 另 一 项 理 
由 不 逃避 那个 工作 ,所 以 “追求 ”应 该 被 包含 在 “不 逃避 ”之 内 。 

在 上 面 4 张 二 维 表 里 , 有 相当 类 似 比 例 的 个 案 遵循 包含 的 ma (zx) > mp (x) 
规则 。 排 除 在 相关 集合 内 没有 归属 值 的 案例 之 后 ,在 第 一 张 .第 二 张 .第 三 张 与 
第 四 张 表 中 ,其 比例 依 序 分 别 为 0. 887、0. 889、0. 891 与 0. 889。 然 而 ,最 上 方 
那 张 表 其 实 是 由 跨栏 的 两 个 独立 偏向 分 布 所 组 成 ,从 这 个 表 得 到 的 卡 方 分 布 是 
X (36) = 3. 669, 非常 符合 独立 模型 的 状况 。 这 个 表 中 看 似 强烈 的 包含 关系 ,其 
实 是 由 两 个 分 布 本 身 的 独立 偏向 造成 的 结果 。 

让 我 们 转向 表 5. 2 里 的 另外 3 张 表 ,第 二 张 表 的 卡 方 检定 是 x (36) = 
234. 036, 第 三 张 表 是 X (36) = 1781. 344, 第 四 张 表 则 是 x? (36) = 3625. 220, 
显示 两 个 变量 之 间 不 是 独立 的 关系 。 然 而 ,第 三 张 表 与 第 四 张 表 显示 强烈 的 相 
关 关系 而 不 是 包含 关系 ,尽管 这 两 张 表 符合 模糊 包含 规则 的 个 案 比例 对 第 二 张 表 
来 说 都 是 显著 的 。 许 多 研究 者 宁愿 说 第 三 张 与 第 四 张 表 的 相关 系数 测量 的 是 两 
个 变量 之 间 一 对 一 的 关联 程度 ,而 非 一 对 多 的 必要 条 件 。 我 们 可 以 轻易 想象 并 发 
现 “ 中 介 的 ”情况 ,其 中 同时 有 稳定 的 强烈 相关 性 与 合理 的 强烈 包含 关系 。 

那么 ,我 们 该 选择 哪 种 解释 ,又 为 何如 此 ? 由 于 需要 更 多 的 判断 标准 ,这 个 
问题 比 单纯 侦 测 出 独立 的 情况 要 难 多 了 。 例 如 ,假如 相关 系数 提供 了 一 个 对 关 
系 “ 好 的 ” 投 述 (也 就 是 说 ,所 有 假设 与 必要 条 件 , 像 同方 差 性 之 类 ,都 得 到 满 
E) ,包含 性 的 解释 仍然 可 能 在 理论 上 更 相关 。 另 外 ,包含 是 一 个 一 对 多 的 关 
系 ,因此 与 相关 系数 或 强烈 的 关联 测量 相 比 ,是 较 不 精确 的 命题 。 

让 我 们 先 排除 独立 十 偏向 的 情况 。 独 立 十 偏向 不 能 成 为 真正 的 包含 关系 
是 因为 ,在 两 个 统计 独立 的 随机 变量 之 间 并 没有 关联 。 然 而 ,就 像 例 子 所 显示 
的 ,把 偏向 的 统计 独立 随机 变量 设 定 成 符合 模糊 包含 的 形式 并 不 难 。 当 两 个 变 
量 在 统计 上 独立 时 ,它们 的 共同 分 布 完全 被 边际 分 布 所 决定 ,因为 其 共同 分 布 
完全 是 边际 的 产物 ,而 边际 依赖 的 是 归属 赋值 。 就 像 我 们 在 第 3 章 中 所 看 到 的 ， 
归属 赋值 是 一 项 很 困难 的 工作 。 在 赋值 过 程 中 , 人们 最 好 不 要 随便 得 出 结论 ， 
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因为 几乎 无 法 争论 说 给 定 的 赋值 是 错 的 。 对 非 连续 性 的 归属 评价 ,以 此 案 为 
例 , 传 统 对 独立 性 的 卡 方 检定 经 常 是 适当 的 。 对 连续 归属 评价 而 言 ,Kolmogor- 
ov-Smirnov 检验 是 最 广为人知 的 , 它 比 较 了 观察 到 的 共同 累积 分 布 函数 
(JCDF) 与 独立 状态 下 预期 的 共同 累积 分 布 函数 。 

关联 十 偏向 导致 了 其 他 问题 。 我 们 的 观点 是 ,如 果 二 元 分 布 满足 相关 假 
设 , 则 研究 者 应 该 首先 关注 一 个 变量 对 男 一 个 变量 的 预测 ,然后 用 相关 系数 回 
归 描 述 ,或 许 用 模糊 集合 观点 ,或 许 用 GLM 去 同时 估计 位 置 与 离散 的 程度 。 另 
一 方面 ,特殊 类 型 的 异 方差 性 在 包含 同时 ,包括 了 两 个 集合 之 间 的 巨大 规模 差 
异 , 用 类 似 集 合 的 概念 表述 的 且 / 或 研究 问题 ,应 该 认真 考虑 模糊 包含 作为 一 种 
描述 数据 形态 的 工具 。 接 下 来 我 将 介绍 探讨 包含 关系 的 技巧 与 相关 细节 。 


包含 的 量化 与 建 模 


在 很 多 环境 下 ,我 们 希望 能 评价 一 个 包含 关系 的 论点 相对 于 另类 归属 赋值 
的 强烈 程度 。 对 ma (zx) > mpc) 的 规则 与 任何 包含 指数 而 言 ,对 两 个 集合 归 
属 值 的 共同 排序 决定 了 结果 ,因此 有 必要 探讨 ,如 果 改 变 共同 排序 ,包含 比率 或 
指数 赋值 会 产生 什么 变化 。 对 解决 我 们 的 结果 有 多 大 程度 依赖 归属 值 的 共同 
排序 这 个 问题 ,一 个 合理 的 方案 是 ,在 找到 数据 之 前 就 制定 一 个 基准 包含 率 , 然 后 
查 明 在 置信 区 间 里 包含 这 个 比率 或 更 高 比率 的 路 径 的 集群 。 决 定 相关 “集群 ”的 
一 种 方式 是 从 一 个 特定 的 归属 值 的 共同 排序 决定 一 个 路 径 ,其 包含 置信 区 间 包 括 
了 之 前 的 比率 ,然后 查 明 哪个 相 邻 的 路 径 的 置信 区 间 也 包括 这 个 比率 。 

要 知道 上 述 方案 如 何 运作 ,我 们 须 回 到 找 工 作 的 那个 例子 ,运用 一 个 0. 9 的 
资格 包含 比率 。 就 像 我 们 早先 提 到 的 ,从 对 角 线 路 径 计算 遵循 mA (xc) > mp (x) 
规则 的 个 案 比例 为 0. 889。 此 路 径 95% 的 置信 区 间 是 [0. 848，0. 922] ,因此 , 它 
与 包含 率 0. 9 相符 合 ,事实 上 ,这 也 显示 了 任何 路 径 的 比率 低 于 264/305 时 , 仍 
将 得 到 包括 0. 9 的 置信 区 间 。 

K 5. 3 其 实 是 根据 表 5. 2 的 第 二 张 表 重 新 绘 成 。 以 阴影 表示 的 区 域 指出 ， 
在 原始 值 的 共同 排序 里 ,至 少 有 264/305 比例 的 一 个 交错 路 径 的 集群 。 这 个 归 
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属 值 之 共同 排序 与 相应 的 对 角 线路 径 是 0 二 m;(2) = mna (2) <ms (3) = MNA 
(3) <m;(4) = mna (4) < m; (5) = mna (5) < m: (6) = mna (6) < 1, 路 径 的 
集群 构成 一 个 略 低 于 对 角 线 的 区 域 ,例如 ,相应 于 共同 排序 0 < ms(2) = 
mna (2) < ms(3) = mna (3) < ms(4) = mNA(4) < m (5) = mna(5) < 
ms(6) =mna (6) <1, 也 是 由 对 角 延 顺序 的 次 数 分 配 {8, 4, 22, 30, 3, 9, 26} 
而 得 到 的 路 径 。 
表 5.3 0.9 置信 区 间 包 含 比率 
É 求 
不 逃避 0 mD mO) m(4) m6) m,(6) 1 合计 








0 








mya (2) 17 
mna (3) 46 
mna (4) 83 
mya (5) 52 
mya (6) 70 

1 76 
合 it 360 


在 缺乏 包含 率 的 标准 下 ,我 们 或 可 运用 在 共同 排序 标准 中 的 单一 修订 来 发 
现 归属 赋值 对 包含 率 的 敏感 度 。 然 后 ,我 们 从 包含 率 为 0. 889 的 对 角 线 路 径 开 
始 ,这 个 比率 最 大 可 能 的 改变 来 自在 共同 排序 中 的 一 次 修订 ,也 就 是 排除 
{ms(4) = mna (4)) 格子 里 的 30 个 案例 。 将 它们 以 “降低 ?路 径 排 除 在 外 ,将 使 
包含 比率 由 0. 889 降低 到 (271 一 30)/305 = 0. 790。 最 大 的 增加 来 自 共 同 排序 
中 的 一 次 修订 ,包括 了 {m;(4) = mna (3)} 的 10 个 案例 ,这 导致 包含 率 上 升 到 
(271 十 10)/305 = 0. 921 上 中。 这 两 个 例子 都 违反 了 ma (x) > ms (zx) 规则 ,因为 
数据 受到 边缘 分 布 的 严重 影响 ,这 个 包含 指数 也 无 法 区 分 负 相 关 与 真正 的 包 
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含 。 由 拉 津 提供 的 ma (zx) > ms x) 规则 明确 地 假设 边际 分 布 是 单一 的 
(Ragin，2000) ,为 避免 在 边际 分 布 上 作出 强烈 的 假设 ,我 们 必须 转向 以 表格 或 
点 状 图 的 地 方 包含 关系 为 基础 的 包含 模型 。 

运用 表格 或 点 状 图 来 模拟 包含 的 共同 方法 之 一 是 通过 层级 集合 ,也 就 是 第 
2 章 所 讨论 的 问题 。 运 用 建构 出 共同 累积 分 布 函数 的 方式 ,我 们 可 能 建立 表格 
内 任意 一 格 的 包含 率 ( 或 是 画 在 点 状 图 上 )。 在 表 5.4 中 ,第 一 张 表 显示 了 表 5. 3 
的 共同 累积 分 布 函 数 ,这 是 右 下 角 {1, 1}) 那 一 格 往 左 上 移动 的 累积 频率 。 该 起 
始点 有 26 个 案例 ,所 以 上 移 一 格 增加 了 一 个 案例 ,可 获得 27 个 案例 ,而 向 左 移 
可 以 获得 13 个 案例 ,也 就 是 39 个 案例 。 向 上 同时 又 向 右 的 路 径 移 动 可 获得 1 十 
13 十 9 个 案例 ,总 共 就 是 26 十 1 十 13 十 9 = 49 个 案例 ,以 此 类 推 。 

第 二 张 表 显示 了 每 个 格子 的 地 方 包含 率 。 这 些 数 字 是 由 表格 里 的 累积 频 
率 除 以 落 在 首 列 各 栏 的 累积 总 数 而 得 到 的 。 比 如 , 右 下 角 那 一 格 的 数字 就 是 
26 /28 =0. 929, 其 左边 那 一 格 就 是 39/53 = 0. 736, 以 此 类 推 。 我 们 可 以 把 
这 些 比例 视 为 地 方 包含 率 是 因为 ,在 同 层级 的 集合 内 相应 的 格子 里 ,每 个 案 
例 都 遵守 了 ma (z) > mp (x) 的 规则 。 比 如 {0. 83, 0. 83) 那 格 , 其 包括 了 共同 
累积 分 布 函 数 得 到 的 49 个 案例 ,其 中 ,53 个 案例 有 0. 83 或 以 上 属于 追求 的 
归属 值 ,而 且 有 49 个 案例 符合 ma (zx) > mg) 的 规则 ,因为 它们 也 有 0. 83 
或 更 高 的 不 逃避 归属 值 。 这 个 比例 算 起 来 就 是 49/53 = 0.925, 这 正 是 填 人 
第 二 张 表 里 的 数字 。 

层级 集合 与 共同 累积 分 布 函数 取向 使 得 研究 者 得 以 阐明 地 方 包含 率 的 趋 
势 。 请 留意 ,在 对 角 线 上 的 格子 的 包含 率 彼此 很 接近 ,这 个 路 径 争议 性 地 拥有 

一 个 稳定 的 包含 率 , 而 我 们 应 该 简单 说 明 如 何 利 用 这 条 路 径 测 试 一 个 常数 包含 

模型 。 表 5. 4 上 的 包含 率 趋势 与 负 相 关 的 例子 之 间 存 在 鲜明 的 对 比 ,就 像 表 5. 
5 所 显示 的 。 表 5. 5 中 对 角 线 的 包含 率 显然 不 稳定 ,我 们 沿 此 路 径 向 上 与 向 左 
移动 时 ,从 0 突然 跳跃 到 很 高 层次 。 这 个 比较 表明 ,地 方 包含 模型 可 以 区 分 两 种 
关系 ,而 总 包含 率 与 包含 指数 却 做 不 到 。 
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表 5.4 案例 5.3 之 共同 累积 分 布 函数 与 地 方 包含 率 































































共同 累积 分 配 
追 求 

不 逃避 0 m, (2) m,(3) m, (4) m, (5) m, (6) 1 

o | 360 305 261 203 96 53 28 
mya (2) 344 297 | 256 200 94 52 28 
mna (3) 327 288 | 251 198 94 52 28 
mna (4) 281 259 233 | 187 93 52 28 
mal 198 189 174 150 | 86 51 27 
mna (6) 146 142 134 122 81 | 49 | z 

1 76 73 70 68 52 39 | 26 

地 方 包 含 率 
É 求 

不 逃避 0 m, (2) m, (3) m, (4) m;(5) m, (6) 1 

o [| 
mya(2) 0.956 | 0.974 | 0.981 0.985 0.979 0.981 1.000 
ma(3) 0.908 0. 人 0.962 | 0. 0.979 0.981 1.000 
ma(4) 0.781 0.849 0.893 | o. 0.981 1.000 
mm(5) 0.550 0,620 0,667 0, 0. 964 
mya (6) 0.406 0.466 0.513 0.601 

1 0 0. 0.268 0. 





5.5 负 相 关 案 例 之 共同 累积 分 布 函数 与 地 方 包含 率 

















共同 累积 分 配 
追 求 
不 逃避 0 m,(2) mE mO m) mO 1 
o | 360 | 305 213 121 34 20 16 
mya (2) 344 | 289 197 105 18 
mya (3) 340 285 | 








mya (5) 239 184 92 0 
mna (6) 147 92 0 0 
1 55 0 0 0 0 








4 

193 101 14 0 

mya (4) 326 271 179 | 87 0 
E 

0 

0 
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续 表 





不 逃避 0 m, (2) m, (3) m, (4) m, (5) m, (6) 1 


> E 


mna (2) 0. 956 | 0. 948 | 0. 925 0. 868 0. 529 0. 200 0. 000 











mna (3) 0. 944 0. 934 0. 412 0. 000 0. 000 





mna (4) 0. 906 0. 889 0. 840 0. 719 0. 000 0. 000 0. 000 








mya (5) 0. 664 0. 603 0. 432 0. 000 0. 000 | 0. 000 0. 000 





mna (6) 0. 408 0. 302 0. 000 0. 000 0. 000 | 0. 000 | 0. 000 





1 0. 153 0. 000 0. 000 0. 000 0. 000 0. 000 0. 000 


现在 ,让 我 们 用 找 工 作 那 个 例子 的 对 角 线 路 径 来 测试 一 下 稳定 包含 模型 。 
这 条 路 径 上 的 平均 包含 率 是 0. 947 ,我 们 可 以 测试 这 条 路 径 上 的 地 方 包含 率 趋 
势 究竟 是 否 稳定 地 维持 在 一 个 0. 947 的 常数 包含 率 上 。 有 好 几 种 办 法 可 进行 测 
试 ,但 是 最 熟悉 且 或 许 最 简便 的 是 用 卡 方 检定 ,其 原则 是 产生 共同 累积 分 布 函 
数 在 对 角 线 上 的 预期 频率 ,然后 获得 邻近 这 条 路 径 的 格子 的 预期 频率 与 原 数据 
之 差 , 最 后 再 用 单 向 卡 方 检定 来 与 原先 观察 到 的 频率 进行 比较 。 

K 5.6 的 第 一 张 表 呈 现 的 是 从 右 下 角 开 始 ,如 何 通过 观察 频率 获得 邻近 这 条 
路 径 的 格子 的 预期 频率 与 原 数据 之 差 。 第 二 张 表 显 示 如 何 用 0. 947 的 包含 率 为 标 
准 与 第 一 张 表 第 一 列 的 边际 观察 频率 来 计算 预期 频率 。 在 最 左上 角 的 格子 里 , 预 
期 频率 是 71. 165, 这 是 由 360 个 样本 总 数 扣除 其 他 预期 频率 计算 而 得 到 的 。 

由 于 总 共有 7 格 ,自由 度 为 6, 因 此 我 们 用 了 0. 05 的 显著 标准 , 判 准 的 卡 方 
检验 值 应 该 为 12. 592, 观 察 到 的 卡 方 则 是 y? (6) = 3. 257, 低 于 判 准 值 , 这 也 表 
明 ,稳定 包含 模型 与 数据 相符 。 相 对 于 0. 947 的 包含 率 , 我 们 无 法 用 卡 方 检定 来 
拒绝 两 者 相同 的 假设 。 用 稳定 包含 模型 来 获得 一 个 95% 置 信 区 间 并 不 困难 , 虽 
然 我 们 应 该 牢记 的 是 卡 方 检定 比较 保守 ,所 导致 的 置信 区 间 是 [0. 888, 1]。 此 
外 , 找 出 所 有 路 径 群 集 , 使 之 与 稳定 包含 模型 兼容 ,无 论 是 预 设 的 比率 或 普遍 的 
检定 ,都 仍然 是 可 能 的 。 然 而 ,对 这 个 议题 的 探讨 超过 了 本 章 的 范围 。 
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表 5.6 稳定 包含 模型 
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现在 ,让 我 们 用 负 相 关 的 对 角 路 径 为 例 来 测试 稳定 包含 模型 。 表 5. 7 呈现 
了 观察 到 的 频率 ,我 们 可 以 发 现 ,无 论 制定 什么 包含 率 , 卡 方 检 定 都 会 拒绝 表 内 
的 稳定 包含 模型 。 此 处 得 到 最 低 的 卡 方 (其 包含 率 为 1) 是 x (6) = 40.959, HE 
起 我 们 的 判 准 值 12. 592 显然 要 高 得 多 。 这 个 稳定 包含 模型 成 功 地 区 别 了 找 工 
作 与 负 相 关 的 例子 。 


表 5.7 负 相 关 范 例 之 频率 
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此 外 , 它 可 以 轻易 地 用 来 证 明 , 只 有 在 两 个 统计 独立 的 模糊 集合 的 情况 下 ， 
稳定 包含 路 径 才 是 水 平 的 。 对 定 序 分 类 的 归属 函数 与 表格 来 说 ,假设 独立 性 成 
立 , 计 算 预 期 频率 公式 背后 同样 的 论点 , 随 之 可 得 到 这 个 特质 。 由 于 没 考虑 真 
正 包 含 关 系 里 独立 十 偏向 所 造成 的 包含 趋势 ,我 们 的 推理 会 导致 水 平 包含 路 径 
的 结果 。 


量化 与 类 似 成 员 规 模 


当 ma(z) 与 mB(zx) 是 量化 且 可 比较 的 时 候 ,模糊 集合 的 方法 就 很 多 。 现 
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在 ,我 们 通过 一 个 简单 的 调查 来 呈现 研究 者 面 对 这 种 状况 时 的 可 能 性 。 

案例 5. 4: 对 热带 毒物 的 恶 惧 与 强烈 异 恶 

我 们 用 了 向 262 个 心理 学 系 大 学 生 ( 澳 大 利 亚 热带 区 的 詹姆斯 库 克 大 学 ) 收 
集 来 的 调查 数据 ,让 他 们 自行 报告 对 31 种 有 毒 刺激 物 ,例如 ,对 蛇 或 呕吐 物 的 感 
受 。 他 们 被 要 求 对 每 种 毒物 的 恐惧 、 恶 心 与 讨 大 程度 评分 ,分 数 范 围 为 4 级 ,从 
0( 完 全 不 会 ) 到 3( 非 常 )。 这 31 项 恐惧 、 恶 心 与 讨厌 程度 评分 被 加 总 并 区 分 到 
31 个 集合 以 获得 每 个 项 目的 模糊 归属 评价 。 为 了 进行 研究 ,我 们 将 把 这 些 评 价 
当成 量化 可 比 的 归属 值 。 这 个 研究 的 主要 目的 是 检验 一 个 假设 ,这 个 假设 是 在 
仙 慌 类 型 反应 里 , 恺 惧 与 恶心 是 讨 大 的 次 集合 ,而 讨 大 是 一 种 更 为 广泛 的 情绪 
反应 。 一 个 附加 的 问题 是 临床 与 健康 心理 学 提出 的 并 发 率 议 题 , 即 在 什么 情况 
下 , 受 访 者 会 对 毒物 同时 感到 恺 惧 与 恶心 。 


交集 与 并 集 的 势 


从 并 发 率 的 议题 开始 ,传统 的 取向 会 采用 相关 系数 。 表 5. 8 呈现 了 3 个 
模糊 集合 之 间 是 显著 且 稳 定 相 关 。 然 而 ,相关 系数 无 法 告诉 我 们 一 个 集合 是 
否 强烈 包含 另 一 个 ,也 无 法 对 集合 的 相对 规模 与 他 们 的 交集 提供 有 意义 的 
测量 。 

表 5.8 恐惧 .讨厌 与 恶心 的 相关 系数 


恐惧 
0. 434 讨厌 
0.747 0.410 恶心 


我 们 或 许可 以 测量 模糊 集合 的 交集 与 并 集 的 势 , 因 此 可 以 集中 关注 并 发 率 。 
K 5. 9 的 上 半 部 分 呈现 的 是 慌 惧 .恶心 与 讨厌 程度 的 平均 归属 值 ,下 半 部 分 在 对 角 
线 格子 之 外 的 是 平均 归属 值 的 成 对 交集 。 下 半 部 分 显示 的 就 是 每 个 集合 与 男 一 
个 集合 之 间 交 集 的 比例 。 例 如 , 恺 惯 与 讨厌 的 交集 有 平均 归属 值 0.229, 由 于 疏 
AF SY VA JAE Ae 0. 231 而 讨厌 的 平均 归属 值 是 0. 563, 铠 惯 在 交集 里 的 比例 
是 0. 229/0. 231 = 0. 991, 讨厌 的 比例 则 是 0. 229/0. 563 = 0. 407。 
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表 5.9 了 恐惧 讨厌 与 恶心 的 平均 归属 值 及 其 交集 比例 


平均 归属 值 
恐惧 讨厌 恶心 
恐惧 0. 231 
讨厌 0. 229 0. 563 
恶心 0. 181 0. 214 0. 215 
交集 比例 
恐惧 0. 407 0. 842 
0. 991 讨厌 0. 995 
0. 784 0. 380 恶心 


模糊 交集 所 提供 的 并 发 率 图 像 与 相关 性 视角 截然 不 同 , 念 惯 与 恶心 的 并 发 
率 显 然 很 高 (在 交集 之 内 ,和 慌 惧 有 78. 4% 而 恶心 有 84. 2%) ,讨厌 显然 包括 了 大 
多 数 的 丽 惧 与 恶心 (99. 1% 45 99.5%) MARA 38.0% 的 讨厌 被 包含 在 恶心 交集 
内 ,40. 7 儿 被 算 在 丽 惧 交集 内 。 讨 厌 强 烈 包 含 恐 惧 与 恶心 的 发 现 ,得 到 图 5. 2 中 
两 个 点 状 图 的 支持 。 

即使 丽 惧 与 恶心 被 大 致 归 类 到 讨厌 之 内 ,但 恺 惧 与 恶心 的 并 集 是 否 充分 包含 讨 
R? 恐惧 UU 恶 心 的 平均 归属 值 为 0. 266, 远 低 于 讨厌 归属 值 的 一 半 (0. 563)。 事 实 上 ， 
交集 内 的 平均 归属 值 ( 恐 惧 U 恶 心 ) 站 讨厌 是 0. 263, 所 以 ,讨厌 包括 了 
100(0. 263/0. 266) = 98.7% 的 慌 惧 U 恶 心 。 这 些 发 现 指出 ,讨厌 是 一 个 远 比 恐惧 与 
恶心 的 并 集 更 加 广泛 的 分 类 ,这 远 远 超过 相关 或 回归 分 析 可 以 提供 给 我 们 的 信息 。 





恶心 
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5.2 恶心 交集 讨厌 与 恐惧 交集 讨厌 之 点 状 图 


包含 系数 


此 处 ,我 们 转向 包含 系数 ,这 是 把 一 个 集合 包含 另 一 个 集合 的 程度 加 以 量 
化 的 方式 。 最 简单 的 包含 指数 只 是 集合 内 符合 ma (x) > mp (x) 规则 的 个 案 比 
例 , 这 就 是 我 们 第 2 章 提 到 的 经 典 包 含 率 。 虽 然 其 精简 的 特质 很 有 吸引 力 , 但 其 
主要 的 限制 是 ,其 “近乎 消失 ” 像 是 一 个 有 力 的 反例 。 这 里 ,我 们 呈现 两 种 系数 
以 超越 这 个 限制 ,也 就 是 史 密 生 曾 讨论 过 的 “包含 1” 与 “包含 5” 指 数 (Smithson， 
1994)。 第 一 包含 指数 的 定义 为 : 


Tap = >) mays(ai)/ >) mB (zi) [5.3] 


IaB 是 集合 A 与 集合 B 的 交集 除 以 集合 B 的 比例 (Sachez，1979) ,这 很 清楚 是 
基于 模糊 集合 理论 的 概念 。 我 们 通过 表 5. 9 讨论 到 一 个 集合 被 算 入 其 与 男 一 集 
合 交集 内 的 比例 时 ,已 经 使 用 了 这 个 系数 。 

共同 累积 分 布 函 数 、 地 方 包含 取向 与 TAB 之 间 有 重大 的 关联 。 在 表 5. 4 中， 
共同 累积 分 布 函数 数值 在 对 角 线 上 的 加 总 除 以 格子 的 总 数 是 (26 十 49 十 86 十 
187 十 251 十 297)/6 = 149. 333, 这 是 追求 与 不 逃避 某 工作 的 交集 的 势 。 若 二 
0,1, 2,…, K, 4K 是 非 零 归 属 层 级 的 个 数 时 ,我 们 可 以 把 归属 值 当成 &/K。 
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把 累积 分 布 函 数 加 总 并 且 除 以 6, 即 (28 十 53 十 96 十 203 十 261 十 305)/6 = 
157. 667, 则 是 追求 集合 的 规模 ,所 以 其 包含 指数 TAB = 149. 333/157. 667 = 
0.947, 在 我 们 将 归属 值 视 为 &/K 且 当 K 等 于 路 径 内 格子 数量 的 情况 下 ,这 也 
可 以 被 视 为 共同 累积 分 布 函数 在 路 径 上 的 加 总 除 以 所 包含 集合 的 累积 分 布 函 
数 。 这 个 观点 也 就 成 为 稳定 包含 模型 之 0. 947 比率 测试 的 基础 。 
“包含 5” 的 系数 则 被 定义 为 : 
> max(0, ma (xi) — mB (zi)) 


Cag = [5.4] 
i X | ma (zi) —mpg(zi) | 





CA4Bs 是 maA(z) 与 mmB(Zz) 之 间 在 适当 方向 上 偏离 平等 的 比例 ,这 个 公式 事实 上 是 
以 maA(z)>2B(Zz) 不 等 式 为 基础 的 一 般 化 ,用 于 求 不 平等 归属 值 在 观察 值 里 的 
比例 。 

哪 一 个 指数 比较 完美 取决 于 研究 者 的 分 析 目 标 。 首 先 , 每 个 集合 里 归属 值 为 0 
的 个 案 都 不 影响 Lap ,但 却 影响 CAB 。 第 二 ,ma (zi ) 王 mmB(Czi) 的 个 案 不 影响 Ca ， 
但 却 影响 Fas 。 第 三 ,Cas 王 1 一 Caa ,但 IaB 却 没有 这 个 性 质 。 最 后 ,两 个 系数 都 不 
是 个 案 导 向 的 ,这 种 导向 对 估计 的 目的 来 说 有 吸引 力 的 特质 (Smithson, 1987、1994)。 

对 任何 被 设计 来 测量 某 种 特定 关系 但 非 其 他 关系 的 系数 来 说 ,包含 系数 有 
其 限制 。 首 先 ,这 些 包 含 系数 都 无 法 说 明 独 立 性 是 否 成 立 。 此 外 ,就 像 前 面 提 
到 的 ,它们 受 边 际 分 布 的 强烈 影响 。 如 果 包 含 系数 像 2X2 表格 里 的 发 生 率 一 样 
不 受 边际 分 布 影响 ,将 会 很 有 帮助 。 表 5. 10 显示 了 表 5. 2 的 4 个 分 表 里 的 包含 
系数 ,在 独立 的 例子 上 ( 表 5. 2 的 第 一 张 表 ), Iag = 0. 914 而 Cas = 0. 962, 除非 
我 们 已 知 独立 的 情况 ,否则 它们 都 有 很 高 的 包含 率 。 


#5.10 表 5.2 之 包含 系数 





4 一 不 逃避 ”B= 追求 交叉 Ias Tm Cas Cm 
独立 282. 667 90. 833 83.000 0.914 0.294 0.962 0.038 
包含 228.667 157.667 149.333 0.947 0.653 0.905 0.095 


正 相 关 176. 667 183. 000 176. 667 0.965 1.000 0.000 1.000 
负 相 关 241. 833 118. 167 94. 833 0.803 0.392 0.863 0.137 
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此 外 ,两 个 系数 都 无 法 很 好 地 区 别 真正 的 包含 与 偏向 的 负 相 关 案 例 。 最 
后 ,对 高 度 正 相关 的 状况 来 说 , TAB 与 Cas 的 行为 非常 不 同 ,这 是 因为 ,虽然 Dap 
与 TaA 数 值 都 不 是 很 高 ,但 Cap = 1 一 Caa， 所 以 如 果 其 中 一 个 高 , 另 一 个 就 低 。 

然而 ,所 有 这 些 限 制 的 暗示 是 ,包含 系数 其 实 不 适合 告诉 我 们 究竟 该 用 包 
含 还 是 其 他 模型 来 描述 某 个 双 变 量 关 系 。 直 至 现在 ,严肃 处 理 这 个 问题 的 最 好 
办 法 仍 是 用 点 状 图 与 地 方 包含 率 来 模拟 二 元 分 布 。 因 此 , 当 一 个 包含 系数 提供 
了 有 用 的 多 样 性 统计 性 质 时 , 它 也 包括 多 样 统计 的 弱点 。 在 我 们 来 看 ,包含 系 
数 是 对 双 元 集群 关系 或 筛选 多 个 成 对 变量 关系 的 有 用 综述 。 在 第 6 章 中 ,我 们 
会 提供 一 些 案例 来 说 明 ,包含 系数 或 许可 以 一 般 化 并 用 来 获得 多 元 集合 关系 的 
信息 。 


第 6 章 | 多 变量 模 贿 集合 的 关系 


有 So CSE AE SES 


本 章 将 探讨 多 集合 的 关系 与 概念 。 我 们 从 组 成 集合 指针 与 条 件 归属 函数 
开始 ,两 者 能 显示 结合 模糊 集合 工具 与 传统 的 评价 建构 概念 的 优势 。 随 后 ,我 
们 将 重点 放 在 多 集合 的 交集 与 并 集 ,通过 厘清 共同 发 生 、 模 糊 交 集 与 共 变 异 之 
闻 的 关联 ,呈现 模糊 集合 取向 如 何 帮助 我 们 解决 关于 并 发 率 概 念 的 漫长 争论 。 
我 们 希望 通过 案例 的 讨论 来 说 明 , 如 何 运 用 模糊 交集 而 非 相 关系 数 得 到 一 个 并 
发 率 不 同 且 发 生 争 议 时 更 为 清晰 的 视角 。 本 章 将 以 多 重 与 部 分 交集 与 包含 的 


介绍 结束 。 


组 成 集合 指数 


模糊 集合 理论 中 一 个 强大 的 视角 是 ,数学 运算 可 以 用 来 组 成 指数 ,把 某 种 
特定 的 学 术 定义 转化 为 一 种 量化 指数 。 当 然 ,我 们 经 常 做 同样 的 事情 ,但 模糊 
集合 特别 自然 ,这 是 因为 它 在 逻辑 上 或 者 集合 理论 的 风格 上 符合 许多 理论 定 
义 。 例 如 ,理论 上 经 常 认定 某 种 性 质 B 被 定义 为 属于 事物 X 是 因为 符合 一 个 或 
多 个 条 件 , 即 Ar, A2, vr, An ,这 在 数学 上 等 同 于 说 集合 X 必须 有 共同 交集 
ANAN … 站 A4。 如 果 某 些 或 全 部 成 分 集合 都 是 模糊 的 ,那么 ,应 该 可 以 轻 
松 地 求 出 归属 值 : 


mp (ax) = min(m (x), mz (x), +*+, me (x)) [6.1] 


如 果 定 义 可 以 被 转换 成 集合 理论 的 用 语 , 那 么 许多 更 复杂 的 指数 都 是 可 能 
的 。 就 像 我 们 多 次 提 到 的 ,与 加 权 总 值 相 比 , 极 小 一 极 大 算式 并 非 互补 性 的 (在 
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某 些 领域 被 称 为 " 非 交 互 性 ”的 )。 例 如 ,在 公式 6. 1 中 ,Al 的 高 归属 值 不 会 补足 
Ao 的 低 归 属 值 。 因 此 ,研究 者 或 许 希望 考虑 是 否 该 用 标准 的 极 小 一 极 大 算式 或 
其 他 方式 ,如 相 乘 或 概率 加 总 (Smithson，1987:26 一 29) 。 

案例 6. 1: 选 举 民主 指数 

在 第 3 章 里 ,我 们 引进 了 选举 民主 指标 (Munck & Verkuilen, 2003; 
UNDP, 2004) ,就 像 前 面 提 到 的 ,选举 民主 指标 与 4 个 成 分 一 致 :普选 权 (S) 、 执 
政权 (O) .自由 权 (CFE) 与 清廉 权 (C) 。S 指 所 有 成 人 都 有 投票 权 ,O 指 有 决策 权力 
的 官员 (行政 与 立法 ) 都 必须 被 选举 ,下 指 组 织 政党 竞争 与 结社 的 自由 ,而 C 指 
计 票 且 选 举 过 程 公 平 的 权利 。 理 论 思考 建议 我 们 ,这 些 成 分 都 是 必要 条 件 , 因 
此 ,任何 一 个 成 分 缺席 就 足以 使 一 个 国家 被 称 为 “ 非 民 主 ”。 这 就 表示 EDI= 
SNONFNC。 然 而 ,以 上 所 有 成 分 的 程度 仍然 很 重要 ,以 普选 权 来 说 ,广泛 但 
是 未 能 全 面 涵盖 的 情况 是 可 能 的 ,在 美国 20 世纪 60 年 代 的 选举 改革 之 前 ,南方 
对 投票 权 也 设 下 了 广泛 的 限制 。 

因此 ,我 们 必须 定义 模糊 集合 选举 民主 指标 是 上 述 成 分 的 交集 。 标 准 的 取 
HJ mep (x) = min(m, (x), m(x), mf (x), me(x)), 由 于 最 小 算式 不 是 互补 
性 的 ,下 面 这 两 种 国家 将 会 有 同样 的 选举 民主 指标 归属 值 min(0. 25，0. 25， 
0. 25, 0.25) = min(1, 1, 1, 0. 25) = 0. 25。 然 而 ,这 两 个 国家 的 情况 对 多 数 观 
察 家 而 言 是 非常 不 同 的 。 第 一 个 国家 是 表现 全 都 不 好 的 典型 ,而 第 二 个 国家 是 
民主 体制 但 存在 选举 作弊 的 情况 。 相 对 于 交集 的 最 小 算式 ,乘积 算式 也 可 以 被 
运用 : mep (x) = m, (x) Xm (x) X mp (x) Xe(z)。 用 乘积 算式 来 估计 我 们 举 
出 的 两 种 国家 , 则 会 产生 显著 不 同 的 选举 民主 指数 归属 值 , 第 一 国 的 归属 值 是 
0. 004, 第 二 国 的 则 是 0. 25。 


条 件 归属 函数 


对 模糊 集合 的 早期 批评 是 , 它 对 情境 不 敏感 (Amarel,，1984; Zeleny, 
1984) 。 在 同一 个 人 群 里 ,“ 高 大 的 ”模糊 归属 函数 对 男人 与 女人 不 同 , 这 不 需要 
什么 了 不 起 的 智 识 创举 就 能 断定 (Foddy & Smithson，1989) 。 虽 然 在 基本 模糊 
集合 架构 内 ,没有 明显 提出 条 件 归属 值 ,但 这 个 一 般 概念 十 分 易 懂 。 我 们 所 需 
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要 的 只 是 一 个 或 一 个 以 上 的 变量 作为 归属 函数 的 条 件 , 再 加 上 一 个 对 条 件 化 函 
数 的 清楚 定义 。 

然而 ,因为 “条 件 性 的 ?一 词 在 日 常 使 用 中 有 两 个 意思 ,所 以 该 词 可 能 有 误 
导 性 。 第 一 个 意思 是 “预测 性 的 ”, 是 指 A 中 的 归属 值 可 以 被 B 给 定 的 值 所 预 
测 ; 另 一 个 意思 是 “被 给 定 的 ”, 是 指 A 中 的 归属 值 是 被 B 的 值 给 出 的 结果 。 在 

文 一 节 中 ,我 们 将 主要 关注 给 定 的 条 件 归属 值 。 

最 简单 的 给 定 条 件 归属 值 是 一 个 模糊 集合 的 正 态 化 , 即 用 集合 里 最 高 的 值 
去 除 原始 归属 值 。 正 态 化 是 一 种 相对 归属 值 而 言 特殊 化 案例 , 亦 即 归属 值 被 以 
次 集合 里 的 典型 来 衡量 相对 评价 。“ 高 大 男人 ”与 “高 大 女人 ”的 归属 函数 或 许 
可 以 被 当成 归属 值 相对 化 的 例子 。 

另 一 个 更 有 趣 的 条 件 化 形式 是 依赖 一 个 或 多 个 变量 ,其 中 ,集合 A 的 归属 
值 程度 依赖 条 件 化 变量 的 定义 。 史 密生 使 用 了 这 一 类 的 条 件 化 来 测量 不 同 交 
通 运 输 选 择 在 老年 人 口中 的 受 欢 迎 程度 (Smithson，1987:281 一 282) ,没有 私人 
运输 工具 者 不 能 “选择 ?是否 使 用 这 些 服务 ,如 果 只 有 公交 车 可 乘 , 人 们 也 不 能 
“选择 ?是否 搭乘 公交 车 。 因 此 , 若 有 42% 的 人 口 有 私人 交通 工具 而 且 他 们 也 有 
其 他 交通 选择 ,而 32% 的 人 用 私家 车 来 完成 任务 , 则 这 个 选项 条 件 化 的 受 欢迎 
程度 就 是 0. 32/0. 42 = 0.76。 此 外 ,车 72% 的 人 可 以 使 用 公交 车 系统 ,但 其 中 
12% 的 人 没有 其 他 选择 ,导致 32% 的 人 用 公交 车 来 完成 任务 , 则 这 个 选项 条 件 
化 的 受 欢 迎 程度 是 (0. 32 一 0. 12)/(0. 72 一 0.12) = 0. 33。 

案例 6. 2: 杜 林 等 级 

赋予 条 件 评价 的 做 法 在 社会 科学 界 并 不 常用 ,其 中 ,多 数 例外 的 状况 出 现 
在 临床 心理 学 与 风险 评估 的 运用 中 。 可 以 被 当成 条 件 归属 函数 的 例子 是 杜 林 
等 级 (Binzel, 1999) ,这 是 由 于 关注 小 行星 撞击 地 球 或 然 率 的 假 警报 造成 公众 的 
困扰 所 发 展 出 来 的 等 级 。 这 个 等 级 的 阔 值 由 小 行星 被 测 到 的 动能 (MT) 与 撞击 
的 概率 所 决定 ,如 图 6. 1 所 示 。 数 字 从 0 到 10, 相 当 于 小 行星 潜在 毁灭 性 撞击 
集合 里 的 归属 程度 。 
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图 6.1 杜 林 等 级 





这 个 等 级 最 具 启 发 性 的 视角 也 许 是 ,撞击 概率 的 闵 值 从 一 级 升 高 到 另 一 级 
是 根据 动能 的 条 件 。 很 明显 , 当 动 能 增加 时 ,其 中 3 个 阔 值 就 降低 了 ,显示 出 更 
高 的 撞击 或 然 率 风险 (更 低 回避 )。 以 此 为 例 , 有 同样 归属 值 表示 同样 的 预期 能 
量 ,例如 ,在 1 与 2 之 间 的 层次 ,MT 为 100 加 上 撞击 概率 为 10 的 事件 会 与 
MT 为 108 加 上 撞击 概率 为 10 “6 的 事件 相等 。 


多 集合 关系 : 并 发 率 、 共 变异 数 与 共同 发 生 率 


接 下 来 ,我 们 将 模糊 集合 概念 里 的 交集 、 并 集 与 包含 一 般 化 到 超过 两 个 集 
合 的 情况 。 首 先 ,我 们 将 以 案例 来 运用 多 集合 模糊 交集 与 相关 概念 ,以 显示 该 
理论 对 关注 并 发 率 概念 的 宛 长 争论 作出 的 贡献 。 

在 健康 导向 的 学 科 领 域 ,如 临床 心理 学 ,并 发 率 指 两 个 或 两 个 以 上 的 症状 
同时 出 现 。 从 医疗 领域 借用 的 这 个 概念 遭 到 广泛 的 争论 与 批判 ,部 分 原因 在 
于 ,这 个 概念 与 现象 的 分 类 观点 以 及 医药 疾病 模式 的 起 源 有 关 , 因 此 引起 了 是 
否 适用 的 争议 。 某 些 作者 现在 偏好 共 变 或 同时 发 生 ,但 他 们 把 这 些 概 念 看 成 彼 
此 割裂 的 ,前 者 只 适用 于 向 量 的 观点 ,后 者 则 只 适用 于 分 类 的 观点 。 

这 个 观念 是 不 必要 的 限制 。 模 糊 集合 理论 提供 了 共 变 异 数 与 共同 发 生 率 
两 个 概念 之 间 的 桥梁 。 为 了 简洁 但 又 不 失 普遍 性 起 见 ,我 们 假设 一 个 等 距 层 次 
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的 评价 ,使 我 们 可 以 为 模糊 集合 A 与 模糊 集合 B 内 的 非 归属 者 与 完全 归属 者 定 
出 高 标 与 低 标 。 然 后 我 们 可 以 将 Pearson s R 作为 不 受 评价 影响 的 对 ma 与 mB 
共 变 的 测量 。 但 我 们 仍然 可 以 用 下 述 方式 把 共 变 与 模糊 集合 交集 (共同 发 生 
率 ) 联 结 起 来 。 

建立 这 个 关联 的 最 基本 的 解决 方案 是 变异 数 与 共 变异 数 的 公式 : 


covmAs mp) = >})mamp/N—(>)}ma/N)(>)mB/N) 


var(mA) = Ym /N— (Dma/N)Y [6.2] 


对 样本 进行 估计 时 ,只 需 将 这 些 等 式 的 右边 乘 以 N/(N 一 1) 即 可 。 第 一 条 公 
式 的 重要 性 在 于 >) maamB/N 这 一 项 ,这 是 用 乘积 公式 计算 的 集合 A 与 集合 
B 的 模糊 交集 的 平均 数 ( 即 这 个 交集 比例 化 的 势 )。 换 名 话说, 如果 两 个 集合 
在 统计 上 独立 ,那么 ,两 个 归属 函数 的 共 变 异 数 正 是 它们 的 交集 (共同 发 生 
率 ) 与 预期 交集 的 差 值 。 因 此 ,以 >) mamsB/N 来 测量 的 A 与 B 共 同 发 生 率 
可 以 被 写成 : 
cov(ma » mB) + mamB 
或 是 样本 估计 为 : 
(N—1)cov(ma, mp)/N+mamp [6.3] 

将 A 与 B 的 任何 原始 评价 改 为 模糊 集合 函数 A 与 B 的 线性 转换 都 将 保留 
原来 的 A 与 B 的 共 变 异 值 ,借以 提供 对 共同 发 生 率 的 测量 , 它 测量 在 A 与 B 还 
是 原始 分 布 时 的 简单 函数 。 应 该 注意 的 是 ,在 相关 系数 是 评价 独立 的 意义 上 ， 
共 变 异 数 与 共同 发 生 率 都 不 是 非 向 量 ( 独 立 于 评价 外 ) 的 测量 。 这 个 命题 与 模 
糊 集合 的 一 般 性 质 相符 ,事实 上 ,模糊 集合 确实 依赖 于 归属 函数 的 界定 。 

我 们 已 经 建立 了 一 个 与 共 变 异 数 一 致 的 共同 发 生 率 测量 方式 。 但 在 一 般 
概率 论 .发 生 率 (发 生 比 率 ) 与 共 变异 数 之 间 , 有 一 些 不 明显 的 关联 。 回 顾 第 4 
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章 ,我 们 看 到 ,比例 集 势 与 概率 分 享 了 同样 重要 的 性 质 。 
在 第 4 章 里 ，| All = ma. 我们 可 以 将 发 生 率 一 般 化 为 下 式 : 


Qa = ma/(1—ma) [6. 4] 
可 以 使 maB = >) mamp/N, WAE B 时 ,A 的 条 件 发 生 率 为 : 
QAIB = map (mB — MAB ) [6.5] 


请 注意 ,条 件 发 生 率 或 许 也 可 以 被 表达 成 共 变 异 数 。 最 后 ,一 般 化 的 跨 乘 积 发 
生 比 率 QalB/QAI~B 为 : 


_ map (1 — ma — mB MaB) 





这 些 定义 将 意义 赋予 共 变异 数 与 平均 数 等 公式 。 

因此 ,我们 可 以 强调 关注 共同 发 生 率 的 问题 ,不 是 通过 强调 共 变异 数 本 身 ， 
而 是 通过 共 变 异 数 的 公式 ,而 且 是 当 我 们 用 乘积 算式 来 运算 时 。 这 包括 下 列 各 
点 :(1) 不 考虑 任何 其 他 的 分 类 时 (也 就 是 在 其 他 分 类 里 的 共同 发 生 被 排除 的 情 
况 下 ) ,一 个 分 类 里 的 平均 归属 值 是 多 少 ?(2) 两 个 分 类 以 上 的 平均 共同 发 生 率 
怎样 计算 ? (3) 组 合 分 类 时 (例如 ,A 或 B 但 非 C) 的 平均 归属 值 怎样 计算 ? 
(4) 在 一 个 样本 里 所 得 到 的 共同 发 生 率 分 布 如 何 与 男 一 个 样本 比较 ? 

我 们 现在 讨论 两 个 以 上 模糊 集合 的 共同 发 生 率 与 共 变异 数 的 关系 。 或 许 
最 直接 的 方法 是 用 乘积 算式 来 思考 3 个 模糊 集合 的 交集 , 即 一 个 模糊 集合 与 另 
外 两 个 的 乘积 之 间 的 共 变异 数 。 例 如 ,由 公式 6. 2 与 公式 6. 3 我 们 可 以 得 到 ， 


cov(ma + MBC) = MABC — MAM BC 
= MABC — mA (cov(mB, mc) +mBmc) 
因此 ， 
MABC = cov(mAs mpc) + mAmBc [6. 7] 
= cov(mB, mpc) — ma (cov(mB, mc) +mpmc) 


与 之 前 一 样 ,若是 用 样本 估计 , 则 将 这 些 等 式 的 右边 乘 以 N/(N 一 1) 即 可 。 当 
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然 ,我 们 也 可 以 获得 cov(mp, mac) 5 cov(Cmc，zaas) 相 应 的 公式 , 像 这 样 建立 
任何 数量 的 模糊 集合 的 乘积 交集 的 共 变 异 数 与 平均 数 并 不 困难 。 然 而 ,多 集合 
交集 显然 不 能 简化 到 双 变 量 的 形式 ,其 结果 是 估计 公式 的 不 一 致 。 

在 继续 演示 之 前 ,这 里 有 另外 两 个 议题 需要 先 讨论 。 首 先 ,如 之 前 提示 的 ， 
我 们 可 以 在 极 小 算式 与 乘积 算式 之 间 , 选 择 共 同 发 生 率 与 并 发 率 的 测量 方式 。 
乘积 算式 与 共 变 异 数 直接 相关 ,如 前 所 述 ,这 个 算法 有 其 优势 。 然 而 , 极 小 算式 
在 处 理 共 同 发 生 率 时 有 更 重要 的 解释 性 优势 ,也 就 是 说 , 它 确 实 对 应 于 某 人 或 
某 事物 有 某 种 症候 群 Al ,，Az ,， +, Ae 已 经 达到 最 小 程度 XX 的 概念 。 而 且 在 证 
候 群 数目 增加 时 , 它 也 不 像 乘 积 算式 那样 明显 下 降 , 因 此 它 在 某 些 比较 分 析 中 
更 容易 解释 。 例 如 , 某 人 在 5 种 症候 群 都 出 现 部 分 症状 时 的 极 小 算式 有 0. 8, 会 被 
认为 并 发 率 有 0. 8, 但 是 在 乘积 算式 估计 下 会 变 成 (0. 8)5 = 0. 328, 相对 于 简单 乘 
积 ,几何 平均 也 可 以 作为 一 种 明显 正确 的 测量 ,但 我 们 暂时 还 是 用 乘积 来 说 明 。 

第 二 个 议题 是 粗 并 发 率 与 “相对 ”并 发 率 的 标准 化 对 个 别 症候 群发 生 率 的 
计算 。 相 对 并 发 率 与 第 5 章 里 的 公式 5. 3 所 定义 的 包含 系数 TAB 相同 ,也 就 是 
RA BEA 与 B 并 集 里 的 比例 。 此 外 ,在 A 与 B 于 统计 上 独立 的 情况 下 ,相对 
于 预期 共同 发 生 率 , 共 变异 数 也 可 能 是 对 并 发 率 的 一 种 测量 方式 。 结 果 , 当 样 
本 里 的 症候 群 比率 系统 性 地 不 同时 , Ias 与 共 变 异 数 都 可 以 作为 比较 并 发 率 的 
有 效 工具 。 

案例 63:95 RRHWE 

让 我 们 回 到 第 5 章 案例 5. 4 里 那个 262 个 大 学 生 对 31 AEM RE 
与 恶心 比率 的 例子 。 我 们 已 经 看 到 ,用 极 小 算式 来 测量 并 发 率 会 导致 与 相关 系 
数 非常 不 一 样 的 趋势 ,包括 讨厌 强烈 包含 恶心 与 忍 惧 。 这 里 ,我 们 用 同一 个 例 
子 去 演绎 共 变 异 数 、 乘 积 算式 的 并 发 率 与 一 般 化 的 发 生 率 之 间 的 关系 。 

表 6. 1 的 上 半 部 分 显示 了 3 个 模糊 集合 的 平均 归属 值 ,它们 与 平均 乘积 交 
集 归 属 值 并 列 ; 下 半 部 分 显示 的 是 共 变 异 数 。 公 式 6. 1 与 这 些 计 算 相 关 , 例 如 ， 
设 定 A= BWR, WA : 


cov(ma, mB) = (262/261)L0. 1395 — (0. 2315) (0. 5633) ] = 0. 0092 
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表 6.1 丽 惧 .讨厌 与 恶心 的 共 变 异 数 


平均 乘积 归属 值 (并 发 症 ) 

A=W B= 二 讨厌 C 王 恶心 
7k tH 0. 2315 
讨 厌 0. 1395 0. 5633 
i 心 0. 0696 0. 1302 0. 2152 

共 变 异 数 
0. 0092 讨厌 
0. 0199 0. 0090 恶心 


表 6. 1 提供 了 所 有 我 们 需要 的 信息 来 概 推 发 生 率 与 发 生 比 率 ,例如 ,从 公式 
6.5 与 公式 6. 6, 我 们 可 以 得 到 : 
(BIA = 0. 1395/(0. 2315 — 0. 1395) = 1. 5181 
QB|~A = (0. 5633 — 0. 1395)/(1 — 0. 2315 — 0. 5633 + 0. 1395) = 1. 2290 
QBIA/QBI~A = 1. 2353 
CRE Uh, 2A ET TR EB FE ALT BY TRA — BL AE RY 1. 24 倍 。 
因为 3 个 模糊 集合 有 重 秋 ,所 以 计算 它们 三 者 中 各 自 的 排除 性 归属 值 也 是 合 
理 的 ,也 就 是 说 ,我 们 希望 比较 ALY BEE CR AN~BQ~C, BNQ~AN~C, 
CA~AN~ B 的 势 。 在 第 5 章 里 ,我 们 已 经 看 到 ,讨厌 强烈 包含 了 铠 惧 与 恶心 ， 
所 以 我 们 应 该 预期 ,相对 于 AN 门 ~~B 门 ~~C 及 CN 门 ~~ANMm~B 与 A 及 C 的 关系 ， 
B 门 ~~A N~ CARRIE B 的 规模 。 在 表 6. 2 中 ,我 们 可 以 看 到 这 些 预期 被 证 实 。 
表 6.2 恐惧 .讨厌 与 恶心 的 平均 排除 性 归属 





焦点 集 交集 
a E 0. 2315 
非 讨 厌 与 非 恶心 0. 0674 0. 3517 
it 大 0. 5633 
JERR SER O 0. 3387 0. 6629 
ik 心 0. 2152 


非 恐 惧 与 非 讨厌 0. 0605 0. 3448 
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案例 6. 4: 儿 童 之 间 的 心理 症状 

通过 被 广泛 使 用 的 儿童 行为 检查 表 (Achenbach, 1991) , 霍 贝 克 发 展 了 一 个 
儿童 心理 症候 群 的 模型 (Heubeck，2001), 使 用 了 一 个 包括 3712 个 儿童 的 样 
本 ,他 们 曾经 因为 心理 或 /及 行为 上 的 干扰 被 转 介 到 诊所 ,另外 在 同一 个 区 域 又 
挑 出 了 3400 个 不 曾 被 转 介 去 诊所 的 儿童 。 在 最 终 模型 里 的 这 7 项 症候 群 依 序 
H:A SR, A SEHH, As = 焦虑/ WR, As = 思虑 失 序 ,As = 无 法 集 
中 ,A6 = 冒犯 ,Az = 攻击 性 。 

这 7 个 症候 群 的 要 素 评 分 以 组 成 临床 心理 协议 与 症状 条 件 的 方式 被 转换 成 
模糊 归属 函数 。 一 种 传统 的 处 理 分 类 症状 临界 点 的 方式 是 使 用 整体 样本 分 布 
里 的 高 百分比 数 点 (如 95%), 男 一 种 方式 是 用 logistic 回归 ,以 p( 就 医 ) = 1/2 
为 临界 点 ,去 预测 一 个 个 案 会 不 会 被 转 介 去 就 医 。 此 处 使 用 的 折衷 方式 是 把 
logistic 回 归 的 截 点 当成 归属 值 为 0 的 上 限 , 并 且 以 95 百 分 位 点 的 不 转 介 样 本 
为 中 立 点 (归属 值 为 1/2)。 例 如 ,在 整体 抽样 里 ,Al 要 素 第 95 个 百 分 位 点 的 
Xi1 评 分 为 0.5726。logistic 回归 对 就 医 与 整体 样本 的 预测 是 : 

In(p/(1—p)) 一 0.1 十 2.11X1 


p= p GRE) BAS 24 p= 1/2 WY, X1 =— 0. 0452。 第 95 个 百 分 位 点 的 非 
就 医 样本 则 是 X ON = 0.5726, He He ix HE BE ME Pr 1S BY Be HE ee UE A JE ew R 
则 是 : 

mı = maxL0，min((X1 — X10))/2CX1N95) — X10), 1) 4] 


这 个 例子 的 结果 是 一 个 0 到 1/2 的 归属 值 之 间 , 从 第 78 到 第 95 个 百 分 位 点 的 
整体 样本 的 “窗口 ”, 然 后 是 一 个 从 1/2 到 1 的 就 医 样 本 ,从 第 20 到 第 79 个 百 分 
位 点 。 

我 们 首先 阐明 这 些 归属 函数 之 间 就 医 样 本 与 非 就 医 样本 的 相关 系数 ,并 将 
其 显示 于 表 6. 3 中 。 非 就 医 组 多 数 的 相关 系数 都 比 已 就 医 组 样本 的 相关 系数 高 
(在 21 个 中 占 13 个 ), 就 算 我 们 用 tau 相关 系数 而 不 是 Pearson 的 相关 系数 , 结 
果 也 差不多 。 尽 管 这 些 差异 不 是 很 大 ,但 这 些 相关 系数 还 是 可 能 使 我 们 作出 下 
列 结论 , 即 非 就 医 组 的 成 对 并 发 率 比 较 高 。 这 个 结论 可 能 大 错 特 错 。 
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表 6.3 非 就 医 样本 与 就 医 样本 的 相关 系数 
RO w EAE 焦虑 /恐惧 思虑 失 序 无 法 集中 ”冒犯 攻击 性 





AK 六 1 0. 3377 0.6117 0.4818 0.2873 0.1286 0.2474 
生理 问题 0. 3123 1 0.5224 0.5077 0.1244 0.2084 0.2107 
焦虑 /恐惧 0.5861 0.4551 1 0.5690 0.1422 0.1867 0.2090 
思虑 失 序 0.4455 0.4646 0.4804 1 0.4406 0.2304 0.3759 
无 法 集中 0.4632 0.2686 0.3161 0.5615 1 0.1836 0.5316 

冒 犯 0.1949 0.2823 0.2474 0.3021 0.2534 1 0.1757 

攻击 性 0.3953 0.3062 0.3075: 0.4372 0.5279 0.2306 1 


表 6. 4 显示 了 两 个 样本 的 平均 数 与 其 比率 的 比较 ,一 如 预期 ,在 每 个 症状 的 
平均 归属 值 方面 ,就 医 组 都 比 非 就 医 组 明显 偏 高 。 表 6. 5 显示 了 两 组 样本 的 成 
对 并 发 率 (用 乘积 算式 ) 与 两 者 相 较 的 比率 ,组 间 每 种 并 发 率 的 相对 比率 都 远 高 
于 个 别 症状 的 相对 比率 。 因 此 很 清楚 ,无 论 是 粗 并 发 比率 还 是 相对 并 发 比率 ， 
就 医 组 都 比 非 就 医 组 高 得 多 。 

表 6.4 非 就 医 样本 与 就 医 样本 的 平均 数 





平均 数 平均 数 ( 就 医 样本 ) 比 率 

7K Ri 0. 0743 0. 4974 6. 6955 
生理 问题 0. 0909 0. 3107 3. 4164 
E/I 0. 0757 0. 5185 6. 8488 
思虑 失 序 0. 0686 0. 5279 7. 6994 
无 法 集中 0. 0725 0. 5672 7. 8178 
冒 犯 0. 0594 0. 2761 4. 6441 
攻击 性 0. 0681 0. 5535 8. 1245 


表 6.5 非 就 医 样本 与 就 医 样 本 的 成 对 并 发 症 与 其 比率 








并 发 症 
戒 疗 ”生理 问题 焦虑 /恐惧 思虑 失 序 无 法 集中 E 犯 攻击 性 
R RW 1 0.1957 0.3494 0.3338 0.3247 0.1509 0.3124 
生理 问题 0.0174 1 0.2281 0.2284 0.1920 0.1046 0.1990 
IE/ÆE 0.0262 0.0223 1 0.3623 0.3162 0.1638 0.3199 


思虑 失 序 0.0205 0.0217 0.0216 1 0.3674 0.1710 0.3508 
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续 表 
并 发 症 
7K OR EPA 焦虑 /恐惧 思虑 失 序 无 法 集中 冒犯 ”攻击 性 
无 法 集中 0.0220 0.0159 0.0167 0.0246 1 0.1767 0.3969 
a 4 0.0097 0.0128 0.0111 0.0120 0.0112 1 0. 1723 
攻击 性 0.0186 0.0163 0.0156 0.0192 0.0232 0.0101 1 
并 发 症 比率 
yO EHE RER 思虑 失 序 无 法 集中 A 犯 ” 攻击 性 
WO 1 11.2181 13.3414 16.3212 14.7685 15.5718 16.7976 
生理 问题 1 10. 2231 10.5201 12.0800 8.1825 12.1933 
焦虑 /恐惧 1 16. 7753 18.9229 14.7207 20.5270 
思虑 失 序 1 14. 9588 14.2156 18.2309 
无 法 集中 1 15.7146 17. 0892 
a 犯 1 17. 0961 
攻击 性 1 


事实 上 ,所 有 3 种 并 发 率 的 测量 都 显示 就 医 组 的 数字 高 得 多 , 表 6. 5 中 的 平 
均 粗 并 发 率 是 14. 737( 范 围 在 8. 183 与 20.527 之 间 ) ,因此 可 以 算出 平均 相对 
并 发 比率 是 2. 394( 范 围 在 1. 366 到 3. 682 之 间 )。 最 后 ,对 就 医 组 来 说 , 共 变 异 
数 也 偏 高 ,平均 比率 为 3. 392( 范 围 在 1. 699 到 5. 399 之 间 )。 因 此 ,即使 把 高 症 
状 比率 计算 在 内 ,就 医 组 还 是 比 非 就 医 组 的 成 对 并 发 率 高 得 多 。 这 个 以 共同 发 
生 率 为 基础 ,与 相关 系数 简单 且 明 显 矛 盾 的 “并 发 率 ” 的 比较 ,显示 了 模糊 集合 
取向 计算 并 发 率 时 的 优势 。 

当 并 发 率 包括 超过 两 种 症状 时 ,模糊 集合 取向 的 优势 更 加 明显 。 为 了 展示 
这 一 点 , 表 6.6 显示 了 6 种 或 7 种 并 发 症 出 现 的 情况 ,在 这 个 例子 (同样 只 是 为 
了 说 明 ) 里 ,我 们 用 极 小 算式 来 测量 并 发 率 。 这 个 表格 显示 了 两 个 明确 的 趋势 ， 
首先 ,就 医 组 里 高 得 多 的 并 发 率 倾 向 仍然 持续 , 而 且 事实 上 显示 出 比 成 对 的 并 
发 率 更 高 的 一 致 性 。 表 中 粗 并 发 率 平均 值 是 18. 068, 而 其 相对 并 发 比率 平均 值 
则 是 2. 833 ,这些 平均 数 稍 高 而 变异 数 则 稍 低 。 出 现 这 种 情况 的 原因 是 ,任何 6 
种 症状 归属 值 非 零 且 7 种 症状 归属 值 也 非 零 的 时 候 , 表 6. 6 中 的 6 种 症状 与 7 
种 症状 归属 值 的 平均 数 非常 类 似 。 有 6 种 症状 时 ,平均 并 发 率 有 相当 大 的 增加 ， 
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大 多 数 例外 出 在 冒犯 的 指标 中 ,这 就 把 我 们 引 到 模糊 集合 取向 的 第 二 个 清楚 的 
趋势 , 那 就 是 除了 两 组 样本 并 发 比率 明显 不 同 之 外 ,两 边 都 包含 了 多 种 症状 司 
时 出 现 的 案例 。 这 个 趋势 在 7 种 症状 中 的 6 种 中 存在 ,与 冒犯 的 情况 相 比 时 特 
别 明显 。 

6.6 非 就 医 样本 与 就 医 样本 的 6 种 及 7 种 并 发 症 
”多 重症 状 。 ”原始 值 ”原始 值 “原始 值 比率 ”相对 值 。 相对 值 “相对 值 比率 





7 种 症状 0.0047 0.0843 17.9515 0.0516 0.1486 2. 8782 
REE Sb 0.0051 0.0935 18.1670 0.0566 0.1648 2. 9127 
生理 问题 除外 0.0051 0.1110 21.6250 0.0678 0.1956 2. 8865 
FEB /HRSP 0.0053 0.0888 16.6792 0.0585 0.1565 2. 6742 
思虑 失 序 除 外 0.0049 0.0869 17.8615 0.0535 0.1532 2. 8638 
无 法 集中 除外 0.0054 0.0935 17.2009 0.0598 0.1690 2. 8258 
冒犯 除外 0.0078 0.1382 17.6638 0.0861 0.2437 2. 8320 
攻击 性 除外 0.0054 0.0940 17.3960 0.0594 0.1657 2. 7891 


此 外 ,对 两 组 样本 并 发 率 比较 的 一 种 有 效 交 互 检查 是 与 “单一 ”症状 发 病 率 
进行 比较 。 例 如 , 某 人 有 症状 Al 但 是 没有 任何 其 他 并 发 症 的 程度 可 以 用 
min(mAi, 1 一 min(mAz ,mAs,，…， mA7r)) 来 测量 。 在 表 6. 7 中 ,我 们 可 以 看 
到 ,对 就 医 组 与 非 就 医 组 来 说 , 粗 单一 症状 平均 数 其 实 相 当 接 近 , 就 医 组 平均 值 
其 实 只 稍 高 一 点 。 然 而 ,用 表 6. 4 中 的 粗 症 状 平均 数 比 例 来 把 平均 值 标 准 化 , 结 
果 非 就 医 组 单一 症状 归属 值 的 比例 却 相对 更 高 ,这 个 发 现 与 从 就 医 组 得 到 的 高 
并 发 比率 相同 ,因为 这 显示 了 较 低 的 单一 症状 比率 。 

表 6.7 非 就 医 样本 与 就 医 样本 的 单一 症状 平均 值 与 几率 





平均 值 几率 平均 值 (就 医 ) JL RORE) 
R E 0. 0457 0. 6158 0. 0575 0. 1155 
生理 问题 0. 0682 0. 7499 0. 0383 0. 1233 
Fe E/T 0. 0488 0. 6452 0. 0641 0. 1236 
思虑 失 序 0. 0392 0. 5711 0. 0495 0. 0938 
无 法 集中 0. 0430 0. 5930 0. 0818 0. 1442 
g 犯 0. 0469 0. 7896 0. 0502 0. 1818 
攻击 性 0. 0429 0. 6303 0. 0786 0. 1419 
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最 后 ,为 了 比较 样本 或 模型 参数 ,我 们 将 简单 展示 高 并 发 率 如 何 由 模糊 交 
集 构 成 ,并 且 与 标准 统计 分 析 技巧 相连 。 假 设 我 们 想 比 较 就 医 组 与 非 就 医 组 在 
7 种 症状 集合 里 的 并 发 比率 。 如 我 们 已 知 的 ,与 非 就 医 组 相 比 ,就 医 组 样本 有 高 
得 多 的 累积 分 布 函 数 。 如 果 我 们 把 归属 程度 当做 一 个 “风险 ”变量 ,而 把 累积 
布 函数 的 倒数 当成 一 个 “生存 ? 率 , 则 我 们 可 以 用 标准 化 的 Kaplan-Meier 分 析 与 
对 数 层级 检验 来 比较 两 组 分 布 ,并 得 出 1101. 61 的 卡 方 检验 值 ,其 表示 两 组 累积 
分 布 函 数 的 倒数 相当 不 同 。 

然而 ,我 们 可 以 用 第 4 章 里 简单 介绍 过 的 删 截 分 布 取向 来 处 理 两 个 样本 的 
分 布 。 我们 可 以 用 双 限 tobit 模型 (Long，1997:205 一 212) 加 上 一 个 潜 变 量 y 
《其 删 截 的 截 点 是 0 与 1) 来 处 理 这些 数 据 。 对 删 截 的 观察 值 来 说 : 


Pr(yi <O | xi) = OC Bri /oi) 


Pr(yi <1 | zi) = 1— OC — Bri/oi) 


中 是 标准 化 的 正 态 累积 分 布 函数 ; 若 第 ;个 案例 是 非 就 医者 , 则 r: = 0, 若是 就 
医者 , 则 zi = 1; 是 非 就 医 样本 或 就 医 样本 的 标准 差 。 对 非 删 截 观察 值 来 说 : 


yi = fxi + ei 


ci NO, o;) 的 分 布 。 

空 模型 加 上 一 个 同方 差 模 型 OO? (1) = 699. 60, p 二 0.0001) 之 后 确实 大 幅 
改善 ,加 上 异 方差 后 ,改善 反而 不 显著 (x* (1) = 0.106, p = 0.745), 最终 模型 
估计 一 个 删 截 分 布 ,其 中 , 非 就 医 样 本 的 平均 值 是 一 0. 684, 就 医 样本 的 平均 值 
是 一 0. 140, 两 者 的 标准 差 是 0. 351。 由 于 样本 规模 相当 大 ,所 以 这 些 相关 系数 
的 标准 误 大 约 是 0.02。0 的 截 点 上 包括 了 97. 43% 的 非 就 医 案例 (与 数据 中 的 
97. 5% 相 比 ) 与 65. 47% 的 就 医 案例 (与 数据 中 的 65. 87% 相 比 ), 构 成 了 一 个 突 
起 。1 的 截 点 上 低估 了 另 一 个 突起 ,包括 了 0. 00008% 的 非 就 医 案例 (与 数据 中 
的 0.147% 相 比 ) 与 0.059% 的 就 医 案例 (与 数据 中 的 0. 350% 相 比 )。 图 6. 2 显 
示 了 最 终 模 型 潜在 的 概率 分 布 函 数 。 
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6.2 就 医 样本 与 非 就 医 样本 7 种 症状 的 归属 函数 


这 个 结果 的 一 种 解释 是 ,在 极 小 算式 下 ,7 种 症状 的 归属 函数 可 以 被 当成 一 
种 真正 频 宽 的 过 滤器 而 不 是 一 种 模糊 集合 的 扩张 器 。 对 另 一 个 例子 ,如 戒 交 与 
焦虑 /忧郁 儿童 的 集合 来 说 , 则 更 像 是 扩张 器 。 我 们 可 以 用 一 个 同方 差 双 限 to- 
bit 模型 来 估计 模糊 交集 的 极 小 算式 ,其 分 布 的 非 就 医 样本 的 平均 值 是 一 0. 408, 
而 就 医 样本 的 平均 值 是 0. 278, 两 者 的 标准 差 都 是 0. 403。 然 而 ,此 交集 却 是 异 
方差 的 (X (1) = 11. 126, p= 0. 0009), 对 非 就 医 样 本 来 说 ,平均 值 为 一 0. 493, 
标准 差 为 0. 473, 对 就 医 样本 来 说 ,平均 值 为 0.279, 标 准 差 为 0. 392。 这 些 发 现 表 
明 ,Al 门 As 的 归属 函数 行为 更 像 是 扩张 器 而 不 是 简单 的 频 宽 过 滤器 。 
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在 案例 6. 4 中 , 当 我 们 计算 单一 症状 比率 时 ,我 们 其 实 已 经 遭遇 了 “部 分 排 
除 ” 的 集合 归属 值 , 即 一 个 人 没有 其 他 症状 ,但 只 有 其 中 一 种 时 的 归属 程度 , 亦 
即 一 种 成 分 多 余 就 可 以 造成 部 分 交集 的 概念 。 令 {Ai}) 为 7 二 1, …, J 的 一 群集 
合 ,共用 个 观察 值 , 令 第 j 个 集合 的 第 i 个 观察 值 为 mi , 当 其 他 集合 被 移 除 
时 ,集合 Ag 与 An 的 部 分 交集 为 : 


Migh.J = min(min(mig, mz), 1 — maxi] ) [6. 8] 


此 处 , maxi] = max; Æ g, h(miy). 
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用 文字 来 表示 ,这 是 指 集合 As 5 Ar 与 其 他 集合 有 交集 的 部 分 , 当 g =h 
时 ,我 们 就 回 到 了 单一 症状 的 例子 。 

部 分 包含 系数 可 以 参考 史 密 生 (Smithson, 1987:162 一 163; 1994:17 一 18) 
的 讨论 以 及 其 对 包含 测量 而 非 模糊 逻辑 的 上 暗示 意义 。 部 分 包含 测量 了 关键 集 
合 与 其 他 集合 交集 的 比例 ,但 不 是 一 些 其 他 集合 的 并 集 : 


Tng/ = > migh.j/>) {Mig [6.9] 


另 一 方面 ,分 部 包含 测量 的 是 以 maxi 来 表示 其 他 集合 的 并 集 被 移 除 之 后 ， 
关键 集合 的 最 小 部 分 ,也 就 是 与 第 二 个 集合 交集 ,但 非 与 其 他 集群 的 并 集 部 分 : 


ing =>, Migh. 1 / 2) ;min(mig » 1 — maxy ) [6. 10] 
另 一 个 有 用 的 比率 是 部 分 交集 除 以 粗 交集 : 
Ing /t = >) migh.1/ >) ;minCmig > mn ) [6.11] 


多 重 交集 指 的 是 任何 集群 内 基本 的 或 组 合成 的 交集 。 我 们 已 经 在 案例 6. 4 
里 遇 上 了 以 6 种 或 7 种 症状 并 发 比率 的 形式 表现 的 多 重 交集 。 多 重 交 集 里 一 个 
有 用 的 特例 是 一 个 关键 集合 与 其 他 集群 交集 或 并 集 的 交集 。 相 应 的 多 重 包含 
系数 可 以 被 简单 定义 为 一 个 多 重 交集 包含 关键 集合 的 比例 。 

案例 6.5: 儿 童 治疗 症候 群 的 分 部 与 部 分 包含 

为 了 展示 前 面 所 提 到 的 概念 如 何 运用 ,我 们 回 到 案例 6. 4 所 引用 的 儿童 治 
疗 数据 ,并 主要 关注 As = 焦虑 / 忧郁 与 A4 = 思虑 失 序 的 交集 。 在 探讨 单一 症 
状 比率 时 ,假设 我 们 希望 找 出 其 他 症状 的 归属 值 被 移 除 时 ,As 与 A, 之 间 的 交 
集 还 有 多 少 ,就 医 样本 里 高 度 多 重症 状 的 比率 显示 ,我 们 应 该 预期 在 就 医 样本 
与 非 就 医 样本 相 比 时 , 剩 下 的 交集 比例 相对 较 少 。 

这 正 是 本 案例 所 显示 的 。 对 就 医 样本 来 说 ,mi34.7 的 平均 值 是 0. 0598, 而 对 
非 就 医 样本 来 说 则 是 0.0190, As 与 Ay 的 平均 部 分 交集 在 就 医 样本 里 确实 较 
大 。 然 而 ,As 与 A4 的 平均 粗 交 集 ( 用 的 是 极 小 算式 ) 对 就 医 样 本 来 说 是 
0. 3958, 对 非 就 医 样本 来 说 是 0.0311。 从 公式 6. 11 中 我 们 可 以 得 到 ,就 医 样本 
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的 I43/7 = 0. 598/0. 3958 = 0. 1511, 非 就 医 样本 的 Fas/J = 0. 0190/ 0. 0311 = 
0. 6109。 因此 , 当 有 其 他 症状 的 归属 值 被 移 除 后 ,就 医 样本 只 剩 下 15%% 的 交集 ， 
对 非 就 医 样本 来 说 却 还 有 61%。 在 非 就 医 样本 中 ,焦虑 /忧郁 与 思虑 失 序 的 交 
集 倾向 不 包括 任何 其 他 症状 ,但 就 医 样 本 却 包含 多 种 症状 。 

进行 类 似 比 较 的 另 一 种 方式 是 用 部 分 交集 系数 。 对 就 医 样本 来 说 ,焦虑 / 
忧郁 的 平均 归属 值 是 0. 5185, 对 非 就 医 样本 来 说 是 0.0757。 对 就 医 样本 来 说 ， 
焦虑 /忧郁 被 包含 在 与 思虑 失 序 之 交集 里 的 比例 是 0. 3958/0. 5185 = 0. 7634, 
当 其 他 症状 被 移 除 时 ,这 个 数据 就 明显 减少 到 I43/; = 0. 0598/0. 5185 = 0. 1153, 
对 非 就 医 样 本 来 说 ,焦虑 /忧郁 被 包含 在 与 思虑 失 序 交集 里 的 比例 是 0.0311/ 
0. 0757 =0. 4108, 但 是 当 其 他 症状 被 移 除 时 , 这 个 数据 减少 到 Jia/ = 
0. 0190/0. 0757 = 0. 2510, 

最 后 ,这 个 例子 也 显示 了 包含 与 部 分 包含 之 间 非 常 不 同 的 视角 。 对 就 医 样 
本 来 说 ，2》) ,min(mi3，1 一 maxy) = 0.0894, 而 对 非 就 医 样 本 来 说 ， 
>) ;min(miz, 1— max; ) 一 0.0536。 从 公式 6. 10 中 我 们 可 以 看 到 ,就 医 样本 的 
分 部 包含 系数 是 Ts.J = 0.0598/0. 0894 = 0. 6689, 而 对 非 就 医 样本 来 说 ， 
143.J 一 0. 0190/0. 0536 = 0. 3545, 这 个 形态 与 上 一 段 计 算 的 粗 包含 系数 的 数值 
非常 类 似 ,也 就 是 说 ,在 两 个 集合 与 其 他 症状 的 交集 被 从 关键 集合 与 其 交集 中 
移 除 之 后 ,焦虑 /忧郁 与 思虑 失 序 的 包含 关系 仍然 很 稳定 。 
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在 这 本 书 中 ,我 们 从 社会 科学 的 很 多 概念 同时 保有 分 类 与 向 量 性 质 的 观察 
开始 ,用 一 种 系统 且 有 价值 的 方式 来 表达 结合 了 集合 论 与 连续 变量 观点 的 模糊 
jai 我 们 希望 能 够 再 次 强调 引用 模糊 集合 的 概念 与 技巧 及 其 与 其 他 技 

合 可 能 产生 的 潜力 。 例 如 ,许多 非 连续 的 潜在 特征 与 潜在 阶级 模型 都 包括 
应 ”模型 (Heinen，1996) 以 及 建构 归属 函数 的 方法 (Manton et al. , 
1994). 

此 外 ,虽然 在 第 3 章 里 ,我 们 只 提 及 了 研究 模糊 集合 的 随机 集合 取向 (尽管 
第 5 章 里 的 稳定 包含 路 径 也 可 以 这 样 解释 ) ,但 用 随机 集合 的 想法 为 基石 来 处 理 
模糊 概率 与 统计 方法 的 整个 体系 已 经 被 建构 起 来 。 最 近 , 一 本 讨论 模糊 概率 与 
统计 运用 的 书 提供 了 结合 模糊 集合 与 统计 的 方法 ,以 加 强 我 们 处 理 不 确定 性 的 
能 力 。 

社会 科学 家 对 本 书 所 展示 的 部 分 模糊 集合 概念 并 不 熟悉 ,而且 只 有 时 间 能 
告诉 我 们 这 些 概念 的 用 处 。 例 如 ,第 4 章 所 探讨 的 模糊 性 与 变异 数 虽 然 相 关 却 
又 有 不 同 , 虽 然 引 进 模糊 性 可 能 对 很 多 研究 目的 有 用 ,但 是 只 有 在 比较 了 使 用 
模糊 性 与 变异 数 的 优 劣 之 后 ,研究 者 才 可 能 决定 哪 一 种 是 最 佳 方法 。 另 外 , 包 
含 或 模糊 集合 取向 处 理 并 发 率 等 概念 ,已 经 直接 给 予 了 我 们 很 多 新 启发 与 结 
论 ,这 是 传统 统计 分 析 不 曾 做 到 的 。 第 5 章 与 第 6 章 的 案例 大 大 展示 了 这 种 
好 处 。 

如 第 3 章 所 建议 的 ,在 模糊 集合 的 辩护 者 与 那些 认为 概率 论 足 以 处 理 任 何 
不 确定 性 的 批评 者 之 间 , 仍 有 持续 的 争辩 。 我 们 认为 ,模糊 集合 理论 提供 了 一 
些 概 率 论 无 法 提供 的 想法 ,但 我 们 绝 不 建议 抛弃 概率 论 的 运用 ,并 且 我 们 也 认 
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识 到 ,这 些 架构 的 角色 尚未 厘清 ,还 有 丰富 的 应 用 可 能 性 。 模 糊 集 合理 论 在 以 
下 几 方 面 有 重大 意义 : 

首先 ,应 当 思考 哪 一 种 途径 在 概念 上 更 有 道理 ,并 能 导致 最 大 的 清晰 度 。 
如 果 分 类 归属 值 的 概率 模型 比 模糊 归属 程度 模型 更 能 澄清 一 个 研究 问题 , 则 概 
率 模 型 更 佳 ; 若 正好 相反 , 则 应 选择 模糊 模型 。 否 则 ,就 像 我 们 在 第 5 章 里 观察 
到 的 ,如 果 预 测 是 主要 目标 , 则 回归 模型 应 该 是 最 佳 途径 。 但 是 遇 上 包含 或 其 
他 集合 之 间 的 关系 , 当 必 要 与 /或 充分 条 件 是 基本 的 关注 点 , 则 模糊 包含 模型 可 
能 更 佳 。 

其 次 , 当 有 疑问 时 ,我 们 应 尝试 两 个 视角 ,并 且 比 较 双方 的 表现 。 由 于 不 同 
视角 可 能 带 来 对 表现 的 不 同 测量 方式 ,如 回归 对 包含 模型 的 例子 ,所 以 这 个 做 
法 可 能 很 难 推行 。 然 而 ,如 我 们 在 第 6 章 里 展示 的 延伸 并 发 率 的 例子 那样 来 比 
较 评 估 两 种 不 同 分 析 方 式 对 同一 组 数据 的 效果 ,在 直觉 基础 上 询问 哪 一 种 分 析 
能 捕捉 到 更 多 有 用 且 具 启发 性 的 结果 仍然 是 可 能 的 。 

第 三 ,应 铭记 在 心 的 是 ,事实 上 ,任何 给 定 的 数学 模型 通常 都 有 两 个 不 同 的 
部 分 :系统 性 的 变异 与 噪声 。 模 糊 集合 理论 提供 了 一 种 将 理论 转变 成 模型 的 新 
可 能 性 ,而 且 可 以 用 现代 统计 估计 与 模型 比较 技巧 加 以 检验 。 也 就 是 说 , 它 允 
许 对 系统 化 的 关系 提出 一 种 新 颖 的 群集 ,并 且 像 模糊 包含 一 样 可 以 被 检验 。 然 
而 ,模糊 集合 理论 在 如 何 处 理 含有 误差 的 测量 方面 没有 提出 什么 方案 。 把 归属 
值 当 成 一 个 随机 变量 并 且 运 用 既 有 的 技术 ,如 用 最 大 拟 合 度 去 检验 新 模型 , 提 
供 了 一 种 严格 处 理 噪声 的 工具 。 

我 们 希望 本 书 所 展示 的 这 些 内 容 可 以 刺激 研究 者 与 方法 学 家 去 进一步 发 
展 与 运用 模糊 集合 ,并 将 其 与 其 他 量化 或 质 化 技巧 结合 。 从 传统 的 假设 检定 到 
数据 探索 的 巨大 范围 之 间 ,我 们 相信 这 种 发 展 的 潜力 将 是 无 穷 的 。 
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选举 民主 指标 
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errors, measurement 
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formalist approach 
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fuzzy aggregation 
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fuzzy intersection 

Fuzzy Logic Model of Perception(F LMP) 
fuzzy logic 
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measurement errors 
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measurement theory 
membership 

membership function 
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membership intersection 
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natural language 
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社会 不 平等 在 定性 和 定量 社会 研究 中 一 直 为 古典 和 现代 社会 理论 家 所 讨论 。 不 平 
等 也 许 是 社会 科学 的 中 心 话题 。 

社会 不 平等 的 定量 评估 是 部 令 昕 和 丹尼尔 Q. 奈 曼 专 著 的 主题 。 作 者 特别 关注 不 
平等 ,比如 ,收入 或 财富 在 不 同 社会 之 间 、 同 一 社会 的 不 同 群体 之 间 以 及 时 间 维 度 上 的 比 
较 。 这 一 话题 根据 预 设 读者 只 有 些许 数学 和 统计 学 背景 的 原则 来 展开 。 

郝 令 昕 和 奈 曼 介绍 了 众所周知 且 使 用 广泛 的 洛 伦 兹 曲线 和 不 平等 的 基尼 指数 ,并 且 
系统 地 提出 了 更 具 一 般 性 的 不 平等 测量 的 原理 和 标准 ,但 他 们 强调 了 对 整体 分 布 进行 比 
较 的 方法 。 比 如 ,除了 对 平均 值 的 关注 ,作者 将 不 平等 研究 与 分 位 数 回 归 方 法 联系 起 来 ， 
这 一 方法 描绘 出 收入 等 反应 变量 的 条 件 分 布 , 而 不 仅仅 是 其 中 心 如 何 随 性 别 、 种 族 和 教 
育 等 解释 变量 而 变化 。 

社会 不 平等 的 定量 研究 往往 建立 在 复杂 社会 调查 基础 之 上 ,这 类 调查 中 的 抽样 误差 
是 不 可 忽略 的 ,而 且 一 般 教 科 书 中 基于 独立 随机 抽样 的 推断 方法 并 不 适用 于 这 类 调查 。 
因此 ,部 令 昕 和 奈 曼 将 他 们 的 讨论 与 可 用 软件 联系 起 来 ,介绍 了 适用 于 以 此 类 数据 对 不 
平等 测量 进行 统计 推断 的 方法 。 他 们 的 讨论 同时 包括 标准 的 渐进 方法 和 一 种 基于 自 举 
法 的 方法 。 

本 书 广泛 的 内 容 和 详尽 易 懂 的 讨论 ,将 为 在 这 一 重要 领域 中 从 事 工作 的 研究 者 提供 
巨大 的 帮助 。 
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本 书 有 两 个 目标 。 第 一 ,回顾 一 系列 被 广泛 使 用 的 概要 不 平等 测量 和 不 为 
大 家 所 熟悉 的 相对 分 布 方法 ,介绍 每 一 个 测量 和 方法 背后 的 基本 原理 ,并 对 它 
们 的 联系 进行 讨论 。 第 二 ,本 书 介绍 了 一 项 技术 ,以 分 位 数 回归 来 对 时 间 维 度 
上 的 不 平等 进行 基于 模型 的 分 解 。 这 一 基于 模型 的 方法 使 我 们 能 够 对 两 个 时 
点 之 间 导 致 不 平等 变化 的 两 个 不 同 因素 进行 评估 。 一 个 是 促成 因素 , 它 指 协 变 
量 的 构成 变化 , 另 一 个 是 在 给 定 协 变量 的 情况 下 ,反应 变量 的 条 件 分 布 的 变化 。 

社会 不 平等 是 社会 科学 的 核心 。 社 会 学 长 期 以 来 一 直 关注 由 社会 结构 所 
塑造 的 资源 和 机 会 上 的 个 体 和 群体 之 间 的 不 平等 (Blau，1977) ,并 论述 过 不 平 
等 概要 测量 的 理论 和 方法 论 意 蕴 (Allison, 1978)。 已 有 大 量 经 验 研究 围绕 着 资 
源 和 健康 上 不 平等 的 模式 、 趋 势 、 原 因 和 后 果 来 展开 讨论 。 有 大 量 文献 讨论 过 
如 何 测量 不 平等 。 研 究 者 们 创建 了 诸多 概要 不 平等 测量 ,并 已 将 它们 应 用 于 经 
验 研究 中 ,比如 ,基尼 系数 .变异 系数 ,方差 的 对 数 、 泰 尔 不 平等 指数 、 阿 特 金 森 
指数 .广义 焙 等 。 然 而 ,对 这 些 测量 的 介绍 却 并 不 总 是 与 社会 科学 家 们 所 熟悉 
的 概念 相 联 系 。 男 外 ,测量 之 间 的 关系 也 未 得 到 明确 说 明 。 比 如 ,我 们 可 能 想 
知道 ,为 什么 基尼 系数 强调 了 分 布 的 中 间 部 分 ,应 当 如 何 将 基尼 系数 与 广义 炳 
进行 对 比 或 者 如 何 协调 多 个 不 平等 测量 的 使 用 。 此 外 ,在 趋势 研究 中 ,人 口 构 
成 和 属性 的 分 布 往 往 同时 变化 。 因 此 ,有 必要 将 构成 变化 和 条 件 分 布 的 变化 区 
分 开 来 。 本 书 试图 就 这 些 问 题 进行 讨论 。 

我 们 以 平等 一 一 不 存在 不 平等 的 方式 ,来 定义 不 平等 。 平 等 意味 着 资源 的 
均匀 分 布 ,其 中 ,一 个 人 群 中 的 每 个 人 都 能 获取 相同 数量 ( 按 绝 对 量 计算 ) 或 相 
同 份额 ( 按 相 对 量 计算 ) 的 某 一 资源 ,比如 ,收入 或 财富 或 诸如 健康 这 样 的 福利 
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测量 。 平 等 在 真实 世界 中 很 少 存在 。 已 有 的 不 平等 研究 试图 量化 不 平等 的 程 
度 。 请 注意 ,平等 和 公平 是 不 同 的 概念 。 公 平 关注 的 是 整个 社会 的 福利 , 认为 
资源 的 分 配 无 需 平等 。 如 果 社 会 中 的 某 些 成 员 变 富 且 没有 人 变 穷 ,那么 ,这 个 
社会 的 总 福利 就 被 认为 更 大 。 在 随后 的 章节 中 ,我 们 将 会 再 次 谈 到 不 平等 和 社 
会 福利 之 间 的 区 别 。 

我 们 将 社会 之 间 、 社 会 群体 之 间或 时 期 之 间 的 分 布 差异 视 为 不 平等 。 作 为 
一 种 人 口 属性 的 不 平等 可 以 用 多 种 方式 进行 测量 ,包括 概要 不 平等 测量 。 研 究 
者 会 使 用 诸如 基尼 系数 或 泰 尔 指数 等 概要 测量 对 两 个 或 多 个 分 布 的 形状 进行 
比较 。 其 他 不 平等 测量 将 两 个 或 多 个 分 布 之 间 的 其 他 差异 加 以 量化 ,包括 中 心 
位 置 (均值 或 中 位 数 )、 尺 度 ( 标 准 差 或 四 分 位 距 ) 以 及 形状 ( 偏 态 或 峰 态 )。 比 
如 ,在 对 今天 和 10 年 前 收入 分 布 的 比较 中 ,有 3 种 情形 可 以 说 明 这 些 分 布 的 属 
性 的 改变 :第 一 ,每 一 家 庭 户 都 获得 某 一 固定 额度 的 增 量 , 从 而 导致 一 个 纯粹 正 
的 位 置 改变 和 概要 不 平等 测量 的 减 小 (比如 ,更 小 的 基尼 系数 )。 第 二 ,每 一 家 
庭 户 都 获得 某 一 固定 百分比 的 增 量 ,导致 正 的 位 置 改变 以 及 斥 度 增 大 , 而 特定 
的 一 套 概要 不 平等 测量 却 并 未 发 生变 化 (比如 ,基尼 系数 没有 变化 ) 。 第 三 ,处 
在 分 布下 半 部 分 的 家 庭 户 比 处 在 上 半 部 分 的 家 庭 户 经 历 了 一 个 更 小 比例 的 收 
益 ( 正 如 美国 的 收入 分 布 自 1973 年 以 来 所 出 现 的 情形 ) ,导致 正 的 位 置 改变 、 尺 
度 增 大 、 右 偏 态 更 大 以 及 概要 不 平等 测量 的 增 大 (比如 ,更 大 的 基尼 系数 )。 不 
同 概要 不 平等 测量 之 间 的 相互 关系 可 以 通过 将 它们 与 位 置 . 尺 度 和 形状 改变 相 
联系 而 变 得 更 加 清楚 。 

本 书 的 主要 目标 在 于 ,提供 从 分 布 属性 的 角度 来 测量 不 平等 的 基本 原理 。 
我 们 将 介绍 3 套 不 平等 测量 :(1) 概 要 测量 ;(2) 基 于 分 位 数 的 测量 ;(3) 基 于 相对 
分 布 的 测量 。 由 于 存在 大 量 有 关 不 平等 测量 的 文献 ,因此 ,很 难 决 定 这 些 测量 
床 去 就 留 。 本 书 没 有 纳入 贫困 和 集中 测量 或 流动 指数 。 我 们 认为 ,最 重要 的 变 
量 为 连续 变量 ,因此 ,我 们 只 考虑 如 何 基 于 连续 变量 来 测量 不 平等 。 考 虑 到 大 
多 数 社会 科学 家 都 经 常 且 习 惯 于 谈论 分 布 属性 (比如 ,均值 /中 位 值 方 差 、 偏 态 
FER) ,因此 ,我 们 就 利用 了 对 这 些 概 念 的 熟识 性 。 我 们 会 介绍 所 纳入 的 全 部 
不 平等 测量 的 主要 性 质 , 并 讨论 它们 的 优点 和 不 足 。 同 时 ,我 们 避免 对 哪些 测 
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量 更 优 这 样 的 问题 作出 判断 。 

一 些 研 究 者 已 经 介绍 过 对 时 期 之 间 不 平等 来 源 进行 分 解 的 方法 。 使 用 非 
基于 模型 的 分 解 方法 已 经 可 以 在 趋势 研究 中 ,将 条 件 分 布 的 变化 从 协 变量 构成 
变化 中 分 离 出 来 (Cowell，2000)。 一 个 蔡 代 方法 是 基于 回归 模型 的 分 解 
(Oaxaca, 1973) 及 其 对 残 差 所 进行 的 现代 处 理 (Juhn，Murphy & Pierce, 
1993)。 这 一 方法 受到 限制 ,因为 它 被 局 限于 条 件 均值 框架 。 密 度 分 解 上 的 开 
创 性 发 展 将 概要 不 平等 测量 直接 与 它们 所 描述 的 密度 函数 联系 起 来 (Autor， 
Katz & Kearney, 2005; DiNardo, Forth & Lemieux, 1996) 。 基 于 分 位 数 回 归 
的 分 解 方法 (Machado & Mata, 2005) 建立 在 分 位 数 回 归 分 析 之 上 (Hao & 
Naiman，2007;Koenker，2005) , 它 提 供 了 一 种 更 灵活 的 方法 用 于 基于 模型 的 分 
解 。 本 书 将 介绍 分 位 数 回 归 如 何 能 被 用 来 区 分 不 平等 测量 变化 趋势 中 的 构成 
成 分 和 条 件 分 布 成 分 。 

通过 与 连续 反应 变量 Y 的 分 布 相 联系 的 一 个 量 , 本 书 从 头 至 尾 都 在 讨论 与 
不 平等 的 测量 和 分 析 有 关 的 问题 。 第 2 章 介绍 分 布 之 间 的 位 置 .尺度 和 形状 改 
变 以 及 这 些 改变 如 何 将 它们 在 概率 密度 函数 (PDF)、 累 积分 布 函数 (CDF) 和 分 
位 数 函 数 中 显示 出 来 。 该 章 也 会 介绍 标准 的 洛 伦 效 曲线 和 广义 洛 伦 效 曲线 以 
及 分 位 数 函 数 与 洛 伦 兹 曲线 之 间 的 关系 。 和 第 3 章 对 一 套 使 用 广泛 的 概要 不 平等 
测量 进行 回顾 。 第 4 章 讨论 如 何 基于 5 项 原则 在 诸多 概要 不 平等 测量 之 间 进 行 
选择 ,以 及 洛 伦 兹 占 优 如 何 可 被 用 来 指导 选取 最 少量 的 一 套 不 平等 测量 ,对 不 
同人 口 进行 比较 。 第 5 章 讨论 作为 测量 和 分 析 不 平等 的 灵活 工具 的 相对 分 布 方 
法 。 在 第 6 章 中 ,我 们 讨论 了 应 在 怎样 的 条 件 下 使 用 渐 近 推断 方法 或 自 举 推断 
方法 以 及 如 何 基于 调查 数据 得 到 不 平等 测量 的 标准 误 和 置信 区 间 。 第 7 章 致力 
于 介绍 不 平等 趋势 中 非 基于 模型 和 基于 分 位 数 回归 模型 的 分 解 。 应 用 本 书 所 
介绍 的 大 部 分 技术 ,最 后 一 章 将 给 出 一 个 真实 世界 的 研究 范例 ,对 1991 年 和 
2001 年 家 庭 户 收入 和 财富 不 平等 进行 考察 。 

适合 于 不 平等 研究 的 结果 变量 的 例子 出 现在 若干 领域 中 。 人 们 可 能 对 以 
下 内 容 感 兴趣 :经 济 福利 一 一 这 会 引发 对 收入 或 财富 进行 考察 ;学 业 成 绩 一 一 
这 可 由 标准 化 测试 分 数 加 以 测量 ;以 诸如 体重 指数 这 样 的 量 来 描述 健康 。 在 本 
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书 中 ,我们 将 家 庭 户 收 入 作为 一 些 包含 正 数 取 值 变量 的 例子 ,用 家 庭 户 财富 作 
为 一 些 包含 正 数 .0 和 负数 取 值 变量 的 例子 。 尽 管 分 析 单 位 可 以 是 个 体 、 家 庭 或 
家 庭 户 ,但 我 们 选择 家 庭 户 作为 分 析 单 位 ,因为 这 些 资 源 由 家 庭 户 成 员 共 同 分 
享 ,并 且 我 们 对 作为 整体 的 家 庭 户 福利 水 平 感 兴趣 。 家 庭 户 特征 以 户主 的 种 
族 、 教 育 和 年 龄 以 及 家 庭 户 类 型 和 居住 地 进行 测量 。 收 入 或 财富 的 比较 基于 不 
同 社会 群体 或 两 个 时 点 之 间 的 美国 人 口 来 进行 。 处 于 不 平等 不 断 增加 时 期 的 
美国 1991 年 和 2001 年 “收入 与 项 目 参 与 调查 ”SIPP) 提 供 了 用 于 举例 说 明 的 
经 验 数 据 。 数 据 、Stata 程序 和 各 章 的 证 明 附录 都 可 在 本 书 作 者 的 网 站 上 找到 : 
www. ams. jhu. edu/~hao/INEQ_Book, 


第 2 章 | 概率 密度 函数 .累积 分 布 函 数 、 
分 位 数 函 数 和 洛 伦 兹 曲线 


| 





第 2 章 的 目的 是 在 宽泛 意义 上 为 某 一 人 口 特征 的 分 布 属性 (诸如 集中 趋势 、 
离散 度 、 偏 态 和 峰 态 ) 和 不 平等 测量 之 间 的 联系 葛 定 基础 。 我 们 用 一 个 假设 数 
据 来 说 明 位置 改 变 ` 尺 度 改变 或 形状 改变 等 分 布 上 的 变动 如 何 反映 在 均值 ` 方 
差 、 偏 态 和 峰 态 的 变化 上 。 然 后 ,我 们 简要 回顾 概率 密度 函数 和 累积 分 布 函数 ， 
介绍 分 位 数 函 数 , 最 后 基于 分 位 数 函 数 来 介绍 洛 伦 效 曲线 。 洛 伦 效 曲线 提供 了 
可 将 诸多 概要 不 平等 测量 统一 起 来 的 共同 基础 。 


秩 、 概 率 密度 困 数 、 累 积分 布 郴 数 和 息 


我 们 以 收入 为 例 作 为 感 兴趣 的 特征 变量 。 将 对 个 体 i 观测 到 的 收入 数据 记 
为 yi, 那么 ,全 部 的 观测 收入 数据 (未 排序 的 情况 下 ) 可 记 为 yi + Yno SMA 
的 收入 被 从 低 到 高 加 以 排序 时 ,就 得 到 了 有 序 值 yo0) ,，…，ycw。 个 体 收 入 的 
“ 秩 ” 指 的 是 个 体 收 入 在 有 序 值 之 间 所 处 的 位 置 。 秩 对 分 析 和 研究 分 布 属性 很 
有 用 。 彭 (Pen) 在 其 1973 年 提出 ”高矮 排队 法 ”的 文章 中 , 提出 将 收入 想象 成 身 
高 和 从 矮 到 高 列队 的 个 体 。 该 列队 呈现 为 一 条 非 降 的 曲线 。 在 “高 矮 排队 法 ” 
中 ,侏儒 ( 极 低 收入 的 个 体 ) 和 巨人 ( 极 高 收入 的 个 体 ) 引 人 注目 。 我 们 使 用 的 所 
有 基本 工具 ,包括 概率 密度 函数 .累积 分 布 函 数 、 分 位 数 函 数 和 洛 伦 兹 曲线 ,都 
可 建立 在 排序 数据 的 基础 上 。 

个 体 收入 Y 的 概率 密度 函数 fy 曲线 下 方 的 面积 反映 出 各 收入 取 值 区 间 的 
相对 频数 ,从 而 完整 地 描述 收入 的 概率 分 布 。 累 积分 布 函数 Fy 描述 累积 概率 ， 
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即 对 于 任 一 给 定 的 收入 y，Fy(y) 会 给 出 收入 小 于 y 的 概率 。 出 于 纯粹 举例 说 
明 的 目的 ,我 们 生成 了 一 个 假设 具有 对 称 分布 的 收入 变量 YW (把 它 称 为 “ 原 
始 ” 数 据 ) ,图 2. 1 呈现 了 它 的 概率 密度 函数 和 累积 分 布 函 数 。 累 积分 布 函 数 上 
与 图 2. 1(b) 中 的 某 个 y 相对 应 的 p 表达 了 图 2. 1(a) 中 概率 密度 函数 下 直到 y 
点 处 的 面积 。 直 观 地 来 看 ,我 们 可 以 看 到 中 心 位 置 位 于 何 处 、 分 布 有 多 离散 ( 尺 
度 ) 以 及 分 布 的 形状 是 对 称 的 还 是 偏 态 的 。 对 于 如 图 2. 1 所 示 的 正 态 分 布 而 言 ， 
概率 密度 函数 的 形状 呈 轴 对 称 ,而 累积 分 布 函数 的 形状 则 呈 中 心 对 称 。 
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图 2.1 收入 的 假设 正 态 分 布 的 概率 密度 函数 和 累积 分 布 函数 


为 了 更 好 地 理解 分 布 的 特征 ,我 们 来 考虑 如 何以 概率 密度 函数 和 累积 分 布 
函数 来 刻画 位 置 . 斥 度 和 形状 改变 。 首 先 ,位 置 改变 源 于 对 人 口 的 每 一 个 成 员 
增加 或 减少 某 一 固定 额度 的 资源 。 当 对 YO 增加 某 一 常数 a 得 到 了 YO 时 ， 
Y =a +Y O RK YO 定义 成 Yo 的 位 置 改变 。 比 如 , 当 每 个 人 都 得 到 相 
同 额度 的 额外 收入 时 ,结果 就 是 出 现 一 个 正 的 位 置 改变 。 但 是 ,对 每 个 人 征 取 
相同 额度 的 税则 会 导致 一 个 负 的 位 置 改变 。 其 次 ,尺度 改变 源 于 以 某 一 固定 比 
例 增加 或 减少 每 个 人 的 资源 。 如 果 Y2) 是 将 YO 乘 以 某 个 正 的 常数 c 而 得 到 
BY BBA YO =YV RITKE YO 定义 成 Yo 的 尺度 改变 。 比 如 ,每 个 人 可 能 都 
从 其 雇主 处 得 到 某 个 固定 比例 的 工资 上 涨 。 再 次 ,形状 改变 源 于 以 不 同 的 量 增 
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加 或 减少 某 个 总 体 中 成 员 的 资源 。 尽 管 起 初 是 个 对 称 分 布 ,但 如 果 位 于 此 分 布 上 
半 部 分 的 个 体 比 那些 位 于 下 半 部 分 的 个 体 得 到 了 更 高 比例 的 增 量 ,那么 该 分 布 将 
向 右 偏 。 反 之 ,如 果 具 有 更 高 收入 的 个 体 要 缴纳 更 高 的 税 ,那么 ,该 分 布 将 向 左 偏 。 
因此 ,根据 个 体 收 入 的 不 同 来 将 其 收入 乘 以 不 同 的 系数 能 够 导致 反 称 性 改变 。 

图 2.2 将 4 种 改变 (位 置 . 尺 度 、 右 偏 态 和 左 偏 态 ) 的 概率 密度 函数 和 累积 分 
布 函 数 与 收入 的 原始 正 态 分 布 的 概率 密度 函数 和 累积 分 布 函数 进行 了 比较 。 
为 了 便于 比较 ,我 们 用 共同 的 x 和 yy 取 值 范围 画 出 这 些 函 数 。 图 2. 2(a) 中 的 子 
图 显示 :(1) 正 的 位 置 改变 使 概率 密度 函数 向 右 移动 ;(2) 尺 度 改变 使 概率 密度 
函数 向 右 移 动 并 使 其 变 得 更 宽 ;(3) 右 偏 改变 使 概率 密度 函数 向 右 移 动 , 并 使 其 
上 半 部 分 比 下 半 部 分 宽 更 多 ; (4) 左 偏 改变 使 概率 密度 函数 向 左 移动 ,并 使 其 下 
半 部 分 比 上 半 部 分 宽 更 多 。 位 置 改变 和 尺度 改变 之 后 ,概率 密度 函数 仍 是 对 称 
的 ,但 右 偏 态 和 左 偏 态 改变 之 后 , 它 就 变 成 非 对 称 的 了 。 

图 2. 2(b) 将 5 个 累积 分 布 函数 呈现 在 一 幅 图 中 。 实 线 描绘 了 收入 的 原始 
正 态 分 布 。 虚 线 为 位 置 改 变 , 与 实 线 平行 且 位 于 其 右边 。 点 线 描绘 了 尺度 变 
化 , 它 不 再 与 实 线 平行 , 且 上 半 部 分 比 下 半 部 分 向 右 移 得 更 远 。 右 偏 改 变 曲线 
(长 划 线 ) 的 上 半 部 分 向 右 移 得 更 远 ,而 其 底 端 仍然 靠近 原始 曲线 。 左 偏 改变 曲 
线 ( 短 划 线 ) 向 左 移动 ,其 上 半 部 分 移动 得 更 远 而 其 下 半 部 分 仍然 靠近 原始 曲 
线 。 尽 管 位 置 和 尺度 改变 后 的 累积 分 布 函 数 仍 保持 对 称 性 ,但 右 偏 和 左 偏 改 变 
后 的 累积 分 布 函数 则 不 再 保持 对 称 性 。 与 概率 密度 函数 的 模式 相 比 ,累积 分 布 
函数 的 模式 具有 不 同 的 外 观 。 了 解 累积 分 布 函数 模式 有 助 于 我 们 将 已 经 熟悉 
的 概率 密度 函数 与 不 熟悉 的 分 位 数 函 数 联系 起 来 。 

概率 密度 函数 的 属性 可 以 用 “和 矩 ” 从 数值 上 加 以 描述 。 每 一 个 和 矩 就 是 Y 的 
某 次 震 的 期 望 值 , 即 & 阶 矩 , 被 定义 为 ELY*]。 一 阶 矩 就 是 均值 (或 期 望 值 ) y = 
ELY], 它 被 用 来 描述 一 个 分 布 的 集中 趋势 。 更 高 阶 矩 (& 王 2,，3, …) 描述 了 分 
布 更 复杂 的 属性 , 且 在 以 均值 进行 对 中 的 情况 下 通常 更 易于 理解 和 解释 , 即 考 
虑 中 心 矩 便于 我 们 理解 分 布 。& BU EL Y — )* ] 被 定义 成 Y 和 jy 之 间 差 
值 的 & 次 宕 的 期 望 值 。 二 阶 中 心 矩 (方差 ) o2 = EL(Y 一 jy)?],Y fly 之 间 差 值 
平方 的 均值 测量 了 离散 度 ( 尺 度 ) 。 方 差 的 平方 根 c 被 定义 成 分 布 的 标准 差 。 
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图 2.2 收入 的 假设 正 态 分 布 及 其 4 种 改变 的 分 布 : 概 率 密度 函数 和 累积 分 布 函数 
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对 具有 不 同 尺 度 的 分 布 的 更 高 阶 中 心 矩 进行 比较 可 能 较为 困难 ,因此 ,我 
们 通常 将 分 布 加 以 标准 化 ,使 其 方差 等 于 1 ,然后 计算 重新 尺度 化 的 分 布 的 更 高 
阶 中 心 矩 。 因 此 , 阶 标准 化 中 心 矩 便 可 通过 将 & 阶 中 心 矩 除 以 o 得 到 , 故 它 
具有 EL(Y 一 j0)*]/ot 的 形式 。 三 阶 标准 化 中 心 矩 具有 EL(Y 一 py)3 /5 的 形式 ， 
这 个 量 被 定义 为 “ 偏 态 ”。 当 分 布 围绕 着 均值 对 称 时 , 偏 态 取 0 值 。 负 值 意味 着 
左 偏 态 ,而 正 值 则 意味 着 右 偏 态 。 

同样 ,四 阶 中 心 矩 得 到 量 ELY 一 yj)4]/ot ,被 称 为 分 布 的 “ 峰 态 ”。 对 于 高 
斯 ( 正 态 ) 分 布 而 言 , 其 峰 态 系数 是 3。 如 果 峰 态 系数 大 于 3, 那 么 ,这 个 具有 上 比 高 
斯 分 布 更 高 峰 点 的 分 布 被 界定 为 “尖峰 ?[1 ; 当 峰 态 系数 小 于 3 时 , 则 为 “扁平 
峰 ”。 更 高 阶 矩 在 描述 分 布 属性 中 不 常 被 使 用 。 

变量 的 线性 转换 能 够 引起 一 阶 和 二 阶 矩 (均值 和 方差 ) 上 的 变化 .Lj 如 果 Y 
具有 均值 w 和 方差 o? ,那么 ,Y* =atcY 的 均值 和 方差 分 别 为 a 十 ox 和 c2c2 。 
但 是 ,由 于 对 中 和 标准 化 ,标准 化 的 中 心 矩 (比如 , 偏 态 和 峰 态 ) 并 不 受 线性 转换 
的 影响 。 

R 2. 1 的 第 一 行列 出 了 所 生成 收入 数据 ( 罗 ) 的 4 种 矩 。 均 值 为 49051 美 
元 ,标准 差 为 10156 美元 , 偏 态 为 0, 峰 态 为 3。 第 二 行 到 第 五 行 显示 了 4 种 改 
变 一 一 位 置 .尺度 . 右 偏 和 左 偏 一 一 的 每 一 转变 之 后 所 得 概率 分 布 的 矩 。 每 个 
人 的 收入 增加 10000 美元 所 引起 的 位 置 改变 将 使 均值 上 升 10000 美元 ,但 并 未 
改变 原始 分 布 的 标准 差 、. 偏 态 和 峰 态 。 由 每 个 人 的 收入 增加 50% 所 引起 的 尺度 
改变 同时 使 均值 和 标准 差 上 升 ,但 是 , 它 既 不 改变 偏 态 也 不 改变 峰 态 。 位 置 改 
变 和 尺度 改变 都 属于 原始 变量 的 线性 转换 , 因此 并 不 影响 偏 态 和 峰 态 。 由 增加 
某 一 百分比 所 导致 的 右 偏 改 变 会 导致 原始 分 布 的 4 个 矩 都 发 生变 化 一 一 更 大 的 
均值 ,标准 差 , 偏 态 和 更 小 的 峰 态 , 左 偏 改变 则 恰好 相反 。 

表 2. 1 的 最 后 一 列 对 基尼 系数 加 以 比较 ,基尼 系数 的 值 越 大 表明 越 不 平等 。 
尽管 基尼 系数 将 在 下 一 章 加 以 介绍 ,但 这 里 对 它们 进行 比较 的 目的 在 于 表明 ， 
位 置 改变 和 偏 度 改 变 会 在 基尼 系数 的 变化 中 反映 出 来 ,而 尺度 改变 并 不 如 此 。 
因此 ,基尼 是 “尺度 无 关 的 ”。 
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分 位 数 函 数 


分 位 数 函 数 是 用 来 测量 不 平等 的 男 一 个 工具 ,正如 本 章 开 始 所 提 及 彭 的 
“高 矮 排序 法 ?一 文中 所 看 到 的 那样 。 收 入 累积 分 布 函 数 的 逆 函 数 Fy 就 是 分 位 
数 函数 Qy, 且 Qy 表明 了 y 的 取 值 ,因此 ,对 于 取 值 为 0 到 1 之 间 的 每 一 个 可 
能 的 比例 p, 有 Fy(y) = po 
Q = Fy (p) [2.1] 
因此 , 取 值 位 于 Qi 之 下 的 人 口 所 占 比例 为 p (对 于 更 详细 的 定义 , 见 《分 位 数 
回归 》, Hao & Naiman，2007) 。 
表 2.1 收入 的 假设 正 态 分 布 的 矩 和 基尼 系数 及 其 4 种 改变 的 分 布 





分 布 均值 标准 差 偏 态 峰 态 基尼 系数 
原始 分 布 49051 10156 0. 00 3. 00 0. 1167 
位 置 改变 59051 10156 0. 00 3. 00 0. 0969 
尺度 改变 73576 15233 0. 00 3. 00 0. 1167 
右 偏 改变 76441 29399 0. 36 2. 40 0. 2193 
左 偏 改变 43573 6431 一 0. 45 4. 30 0. 0807 


对 于 假设 的 服从 正 态 分 布 的 收入 数据 y ,根据 分 位 数 函 数 得 到 的 中 心 位 
置 . 尺度 和 形状 可 见于 图 2. 3(a) 。 分 位 数 函 数 的 工 轴 和 y 轴 将 累积 分 布 函数 的 
相应 数 轴 互 换 了 位 置 。 因 此 ,不 再 要 求 给 出 某 个 特定 y 值 处 的 累积 概率 p ,我 们 
问 的 是 某 一 特定 p 处 的 y 值 是 多 少 。 我 们 感 兴趣 的 累积 概率 值 包括 :p50( 中 位 
BO) ,p25、p50、p75( 四 分 位 数 ),p20、p40、p60、p80( 五 分 位 数 ) 以 及 pl, =, 
p99( 百 分 位 数 )。 重 新 关注 与 给 定 累 积 概率 相对 应 的 分 位 数 ,有 助 于 在 模型 的 
不 平等 分 析 中 将 收入 当做 因 变 量 。 正 态 分 布 的 分 位 数 函 数 的 对 称 性 与 其 累积 
分 布 的 中 心 对 称 性 很 相似 ,即位 于 分 位 数 函 数 下 半 部 分 的 斜率 ,精确 地 映射 出 
位 于 上 半 部 分 的 那些 斜率 。 正 态 分 布 会 呈现 一 条 与 图 2. 3 中 一 样 的 对 称 曲线 。 

基于 分 位 数 的 测量 提供 了 测量 中 心 位 置 . 尺度 和 形状 以 描述 分 布 属性 的 其 
他 方式 。 众 所 周知 的 基于 分 位 数 的 测量 包括 反映 中 心 位 置 的 中 位 数 (p50) 和 反 
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映 尺 度 或 离散 度 的 p25 和 p75 之 间 的 四 分 互 差 。 这 可 以 灵活 地 扩展 到 不 同 的 
极 差 , 比 如 ,p10 和 p90 之 间或 pl 和 p99 之 间 的 极 差 。p50 到 p90 的 极 差 与 
p10 到 p50 的 极 差 之 比 反 映 偏 态 。 由 于 使 用 均值 和 方差 来 刻画 一 个 既 非 正 态 亦 
非 对 称 分 布 的 集中 趋势 和 离散 度 是 有 问题 的 ,所 以 ,基于 分 位 数 的 测量 提供 了 
一 种 比 使 用 矩 要 丰富 得 多 的 方法 来 描述 分 布 属性 (请 参见 (分 位 数 回 归 》 中 更 详 
细 的 讨论 , Hao & Naiman，2007)。 基 于 分 位 数 的 不 平等 测量 可 被 广泛 应 用 。 
用 中 位 数 而 非 均值 来 描述 收入 分 布 的 集中 趋势 是 一 种 常见 的 做 法 。 研 究 收 入 
不 平等 的 研究 者 们 长 期 以 来 一 直 意识 到 ,使 用 标准 差 来 刻画 偏 态 的 收入 分 布 的 
尺度 的 特征 并 不 恰当 。 相 反 , 收 入 的 自然 对 数 却 经 常 被 用 来 将 偏 态 分 布 变 成 对 
数 正 态 分 布 (Buchinsky, 1994; Juhn et al. , 1993). 

分 位 数 函 数 能 够 清晰 地 刻画 收入 原始 正 态 分 布 的 4 种 改变 的 特征 。 在 图 2. 3 
(b) 中 , 实 线 描绘 了 原始 分 布 。 将 每 个 人 的 收入 增加 10000 美元 所 引起 的 位 置 变化 
使 得 曲线 向 上 移动 (虚线 ) ,并 保持 对 称 性 。 给 予 每 一 个 个 体 相 同 百分比 的 提高 所 
取得 的 尺度 改变 使 曲线 发 生 倾斜 (点 线 ) ,不 过 仍 保持 对 称 性 。 右 偏 改变 后 ,曲线 丧 
失 了 对 称 性 (长 划 线 ) ,其 中 上 端 尾部 的 斜率 比 下 端 尾部 的 斜率 更 陡 ; 左 偏 改 变 后 ， 
曲线 也 丧失 了 对 称 性 ( 短 划 线 ), 其 中 上 端 尾部 的 斜率 比 下 端 尾部 的 斜率 更 缓 。 
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2.3 收入 的 假设 正 态 分 布 的 分 位 数 函 数 及 其 4 种 改变 的 分 布 : 正 态 分 布 和 4 种 改变 
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阁 伦 兹 曲线 


洛 伦 兹 所 介绍 的 洛 伦 兹 曲线 为 基尼 系数 和 其 他 尺度 无 关 的 常量 不 平等 
测量 提供 了 一 个 共同 基础 。 它 能 表明 ,对 于 取 值 为 0 到 1 之 间 的 每 一 个 可 
能 比例 p, 那 些 收入 不 超过 该 p 分 位 数 的 个 体 总 收入 的 比例 。 比 如 ,对 于 
p= 0. 25, 我 们 将 所 有 位 于 p25 或 以 下 的 收入 取 值 加 总 ,同时 表达 其 占 总 收 
入 的 比例 。 

最 直接 的 洛 伦 兹 曲线 的 计算 可 以 用 一 个 包含 nn 个 收入 值 y1 ，…， yn 的 样 
本 来 展示 ,首先 将 它们 排序 成 ya) sts yon ,然后 得 到 : 





L(s/n) = L(p) = (s=0,1, 2, =, n; p= s/n) [2.2] 

因此 ,比如 ,一 个 样本 包含 了 100 名 个 体 ,并 且 他 们 的 收入 都 被 从 小 到 大 地 
进行 排序 ,然后 我 们 将 L(0. 25) 定 义 成 最 低 25 名 个 体 的 总 收入 除 以 全 部 个 体 的 
总 收入 ,1 引 洛 伦 兹 曲线 被 限定 在 0(s = 二 0 时 ) 到 1(s = 二 =n 时 ) 之 间 。 所 生成 的 收入 
数据 (yw ) 的 洛 伦 兹 曲线 如 图 2. 4(a) 所 示 。z 轴 表 明 总 人 数 的 累积 比例 ,y 轴 则 
表明 由 对 应 的 总 人 数 累 积 比例 所 占 的 总 收入 的 累积 比例 。 对 角 的 直线 被 称 为 
“平等 线 ”, 表 明 每 个 人 都 拥有 完全 相同 的 收入 份额 情况 下 将 会 得 到 的 结果 。 对 
平等 的 任何 偏离 都 会 导致 洛 伦 北 曲线 位 于 平等 线 下 方 。 洛 伦 兹 曲线 对 平等 线 
的 偏离 越 大 ,表明 不 平等 程度 越 严重 。 

洛 伦 效 曲线 与 分 位 数 联系 紧密 , 且 可 以 使 用 分 位 数 函 数 进行 表述 。 对 于 一 
个 收入 分 布 具有 以 三 表示 的 概率 密度 函数 的 人 口 ,我 们 会 以 各 分 位 数 的 一 个 函 
数 来 表达 洛 伦 效 曲 线 : 





= Qp) 
L(p) = -9 = 了 工 | ywdy [2. 3] 
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图 2.4 收入 的 假设 正 态 分 布 的 分 位 数 函 数 及 4 种 改变 分 布 的 洛 伦 兹 曲线 : 正 态 分 布 和 4 种 改变 


根据 图 形 ,方程 2. 3 可 被 理解 成 ,图 2. 4(a) 中 p 对 应 着 的 洛 伦 兹 曲线 L(p) 
上 的 收入 份额 就 是 图 2. 3(a) 中 分 位 数 函 数 曲 线 下 方 直至 p 值 处 的 面积 ,因为 它 
被 该 分 位 数 函 数 下 的 总 面积 标准 化 了 ,也 就 是 平均 值 。 正 如 图 2. 4(a) 中 洛 伦 兹 
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曲线 所 显示 的 , 约 40% 的 总 收入 为 该 人 口 下 半 部 分 所 占有 。 如 果 以 整个 分 位 数 
函数 下 方 的 面积 进行 标准 化 ,累积 比例 0. 4 就 等 于 该 分 位 数 下 方 直至 p= 0.5 
处 的 面积 。 
我 们 现在 来 考虑 位 置 改变 .尺度 改变 和 形状 改变 对 洛 伦 兹 曲线 的 影响 。 对 
于 一 个 幅度 为 a(a > 0) 的 正 的 位 置 改变 ,新 的 洛 伦 兹 曲线 不 同 于 原始 的 那 条 : 
Data) aes py: 


L* (s/n) = = = = [2. 4] 
Zi ing EI aent >i" di 








这 一 新 的 洛 伦 效 曲 线 位 于 旧 的 那 条 上 方 , 即 工 *(s/z) > L(s/n), 即使 一 些 
收入 并 不 相同 。 直 觉 上 讲 , 正 的 位 置 改变 使 分 子 增加 得 比分 母 更 多 ,因此 使 得 
洛 伦 兹 曲线 向 上 移动 ;而 负 的 位 置 改变 则 使 分 子 减少 得 比分 母 更 多 , 因此 使 得 
洛 伦 效 曲线 向 下 移动 。 附 录 中 给 出 了 这 一 事实 的 续 密 讨论 。 因 此 ,将 每 一 个 个 
体 的 收入 增加 一 个 相同 的 正 数 a 具有 降低 不 平等 的 效应 。 极 端 地 来 说 , 随 着 a 
趋 于 无 穷 , 洛 伦 兹 曲线 会 接近 于 平等 线 。 图 2. 4(b) 中 , 正 的 位 置 改 变 使 得 原初 
洛 伦 兹 曲线 ( 实 线 ) 略 微 向 上 移动 ,更 加 接近 平等 线 (虚线 )。 

对 于 一 个 幅度 为 clc 0) 的 尺度 改变 ,我 们 有 : 

Es (sj) = a = Se = [2. 5] 

因为 以 均值 进行 了 标准 化 , 故 洛 伦 兹 曲线 并 不 会 随 着 尺度 改变 而 变化 (第 4 
章 中 所 讨论 的 尺度 无 关 原 则 )。 图 2. 4(b) 显 示 , 原 始 的 洛 伦 兹 曲线 和 尺度 改变 
的 洛 伦 效 曲线 完全 相同 。 相 比 而 言 , 正 如 前 一 节 所 显示 的 ,尺度 改变 可 在 概率 
密度 函数 、 累 积分 布 函数 、. 矩 和 分 位 数 郴 数 中 被 察觉 。 

洛 伦 兹 曲线 反映 了 形状 改变 。 图 2. 4(b) 中 , 右 偏 改变 ( 富 者 越 富 ) 将 洛 伦 效 
曲线 向 下 移 至 长 划 线 处 ,更 加 远离 平等 线 。 左 偏 改变 ( 富 人 被 征收 比 穷人 更 多 
的 税 ) 将 洛 伦 效 曲 线 向 上 移 至 短 划 线 处 ,更 加 接近 平等 线 。 

广义 洛 伦 效 曲线 被 发 展 出 来 以 反映 尺度 改变 (Shorrocks，1980) 。 现 在 , 令 
工 轴 表 示 累 积 份额 与 平均 收入 的 积 。 使 用 假设 数据 ,我 们 在 图 2. 5 中 展示 了 原 
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台 正 态 分 布 的 广义 洛 伦 兹 曲线 及 其 通过 将 每 个 人 的 收入 增加 50% 所 导致 的 尺 
度 变 化 所 对 应 的 广义 洛 伦 兹 曲线 。 原 始 分 布 的 平均 收入 为 49051 美元 ,而 其 尺 
度 改 变 的 分 布 的 平均 收入 为 73576 美元 。 这 两 个 分 布 的 常规 治 伦 效 曲线 完全 相 
同 ,但 正 的 尺度 改变 对 应 的 广义 洛 伦 兹 曲线 位 于 原始 分 布 对 应 的 广义 洛 伦 兹 曲 
线 的 上 方 。 而 且 , 图 2. 5 中 的 两 条 广义 洛 伦 兹 曲线 表明 ,尺度 改变 的 人 口 比 原初 
的 人 口 更 富裕 。 


累积 收入 比例 与 平均 收入 的 乘积 (1000 美 元 ) 
S 





0 





L 1 L 1 1 1 es a or 
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 
P 





一 一 原始 分 布 ===- RE 





图 2.5 收入 的 假设 正 态 分 布 的 分 位 数 函 数 及 其 尺度 改变 的 广义 洛 伦 兹 曲线 


小 结 


本 章 扼 要 地 介绍 了 测量 和 分 析 不 平等 的 4 类 基本 工具 。 从 适用 于 所 研究 属 
性 的 最 为 基础 的 概率 密度 函数 工具 开始 讲 起 。 许 多 研究 者 以 查看 属性 的 概率 
分 布 的 形状 作为 其 经 验 研究 工作 的 第 一 步 。 概 率 分 布 的 中 心 矩 一 一 均值 . 方 
差 、 偏 态 和 峰 态 一 一 刻画 了 该 分 布 的 中 心 位 置 . 尺 度 和 形状 的 特征 ,这 些 也 为 研 
究 者 广泛 使 用 。 累 积分 布 函数 是 第 二 类 工具 ,表示 概率 密度 函数 下 方 的 面积 。 
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累积 分 布 函 数 的 逆 函 数 是 分 位 数 函 数 , 这 是 我 们 的 第 三 类 工具 。 最 后 ,第 四 类 
工具 一 一 洛 伦 兹 曲线 一 一 被 作为 分 位 数 函 数 的 一 个 自然 扩展 而 加 以 介绍 ,因为 
洛 伦 兹 曲线 表示 分 位 数 函 数 下 方 标准 化 的 面积 。 广 义 洛 伦 兹 曲线 用 于 应 对 常 
规 洛 伦 兹 曲线 的 尺度 无 关 性 。 

适用 于 不 平等 研究 的 4 类 基本 工具 的 核心 要 素 是 位 置 . 尺 度 和 形状 改变 ,我 
们 借助 这 些 要 素 建立 此 处 所 讨论 的 4 类 基本 工具 之 间 的 相互 关系 。 此 种 相互 关 
系 有 助 于 我 们 将 下 一 章 要 介绍 的 各 种 概要 不 平等 测量 联系 起 来 并 进行 比较 。 
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第 3 章 a | 概要 不 平等 测量 


ne ee 
es — i 


本 章 将 介绍 一 套 适 用 于 资源 或 福利 的 连续 、 非 负 测 量 的 概要 不 平等 测量 ， 
它们 来 自 大 量 的 不 平等 文献 ,特别 是 考 维 尔 的 著作 (Cowell，2000)。 我 们 选取 
变异 系数 基尼 系数 和 泰 尔 指 数 等 被 广泛 使 用 的 测量 以 及 基于 分 位 数 的 测量 
阿 特 金 森 族 指数 .广义 焙 指 数 族 等 不 常 被 使 用 的 测量 。 我 们 使 用 第 2 章 中 的 假 
设 例 子 来 对 每 一 个 测量 加 以 说 明 ,从 而 以 位 置 . 尺 度 和 形状 改变 的 方式 来 前 明 
一 个 不 平等 测量 变化 的 分 析 性 特征 。 然 后 ,我 们 使 用 取 自 “收入 和 项 目 参 与 调 
查 ” 的 1991 年 和 2001 年 的 数据 ,展示 了 真实 世界 中 的 不 平等 随时 间 变 动 而 具有 
组 合 解 释 。 我 们 用 Stata 中 的 软件 包 “inequal7”D 来 得 到 各 种 概要 不 平等 测量 
(Van Kerm, 2001). 
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我 们 考虑 选取 的 测量 是 因为 它们 在 经 验 工作 中 常 被 使 用 ,或 是 因为 它们 具 
有 特定 的 优势 。 我 们 通过 将 概要 不 平等 测量 与 隐 含 着 的 概率 分 布 及 其 分 位 数 
函数 、 洛 伦 兹 曲线 、 社 会 福利 函数 和 信息 理论 联系 起 来 而 加 以 介绍 。 


将 不 平等 测量 与 概率 分 布 联 系 起 来 


最 简单 的 不 平等 测量 可 以 直接 根据 已 排序 的 个 体 收入 而 得 到 。 收 入 的 范 
围 可 被 表达 成 最 小 收入 到 最 大 收入 的 距离 , 即 极 差 R: 


Q 注意 ,数字 7 前 面 是 字母 “al”。 一 一 译 者 注 
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R= Ymax — Ymin [3. 1] 


如 果 我 们 知道 整个 人 口 的 收入 , 极 差 就 会 有 效 地 描述 分 布 的 完整 范围 。 

K 3. 1 的 第 一 行 给 出 了 收入 的 假设 对 称 分 布 及 其 4 种 改变 分 布 的 极 差 。 原 始 

分 布 的 极 差 为 86000 美元 ,纯粹 的 位 置 改 变 并 未 改变 原始 极 差 。 如 表 3. 1 所 

示 , 尺 度 改变 和 右 偏 改变 都 扩大 了 此 范围 ,而 左 偏 改变 则 缩小 了 此 范围 。 使 

用 取 自 SIPP 的 真实 数据 , 表 3. 2 的 第 一 行 表明 ,1991 年 的 收入 极 差 为 

467000 美元 ,2001 年 扩大 到 728000 美元 ,这 反映 了 美国 收入 分 布 的 尺度 和 
表 3.1 5 个 假设 的 收入 分 布 的 不 平等 测量 





不 平等 测量 原始 分 布 位 置 移动 尺度 改变 右 偏 改变 左 偏 改 变 
与 概率 分 布 相 联 系 
1 R( 极 差 )(1000 美元 ) 86 86 128 175 68 
2 VV( 标 准 差 )(1000 美元 ) 10.1 10. 1 15. 2 29.4 6.4 
3 c( 变 异 系数 ) 0.207 0,172 0.207 0.385 0.148 
4 v( 方 差 对 数 ) 0.049 0.032 0.049 0.178 0.026 
5 wi( 对 数 的 方差 ) 0.049 0.032 0.049 0.172 0.026 
基于 分 位 数 函 数 和 洛 伦 效 曲线 
6 p5/p50( 分 位 数 比 ) 0.662 0.720 0.662 0.464 0.728 
7 p95/p50( 分 位 数 比 ) 1.343 1, 284 1.343 1.754 1,208 
8 底部 1/5 的 份额 0.142 0, 152 0.142 0.101 0.1566 
9 顶部 1/5 的 份额 0.258 0, 248 0.258 0.315 0.238 
10 G( 基 尼 系 数 ) 0.117 0.097 0.117 0.219 0.081 
根据 社会 福利 函数 推导 
11 AY? ( 阿 特 金森 指数 , e = 1/2) 0.011 0. 007 0.011 0.038 0.006 
12 Ai ( 阿 特 金森 指数 , e= 1) 0.023 0.015 0.023 0.077 0,012 
13 A: ( 阿 特 金 森 指 数 , e = 2) 0.048 0.032 0.048 0.158 0,026 
根据 信息 理论 得 到 
14 T( 泰 尔 指数 )CPE' O X 0=1) 0.022 0.015 0.022 0.075 0.011 
15 GE Q7 SCH 0 = 0) 0.023 0.016 0.023 0.080 0,012 
16 GE-;(J~ CH 0 =— 1) 0.025 0,016 0.025 0.094 0.013 
17 GE: (J X 0 = 2) 0.021 0.015 0.021 0.074 0.011 
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R32 家庭 户 收 入 的 不 平等 测量 :SIPP(1991 年 和 2001 年 ) 





不 平等 测量 . 1991 2001 

1 ROK) (1000 美元 ) 467 728 

2 JV (标准 差 )(1000 美元 ) 35.8 45.3 

3 c( 变 异 系数 ) 0. 738 0. 900 

4 v( 对 数 方差 ) 0. 790 0. 969 

5 vi1( 对 数 的 方差 ) 0.707 0. 846 
基于 分 位 数 函 数 和 洛 伦 效 曲线 

6 p5/p50( 分 位 数 比 ) 0. 194 0. 190 

7 p95/p50( 分 位 数 比 ) 2. 866 3. 232 

8 底部 1/5 的 份额 0. 048 0. 043 

9 顶部 1/5 的 份额 0. 430 0. 466 

10 G( 基 尼 系 数 ) 0. 385 0. 424 
根据 社会 福利 函数 推导 

11 A’? (Bal RE a RB BK. © = 1/2) 0. 123 0. 149 

12 Ai( 阿 特 金 森 指 数 , e = 1) 0. 251 0. 294 

13 As( 阿 特 金森 指数 , © = 2) 0. 734 0. 875 
根据 信息 理论 得 到 

14 T( 泰 尔 指数 )GE O XW = 1) 0. 244 0. 310 

15 GE, (J SUK 0 = 0) 0. 288 0. 349 

16 GE_; U“ SOR 0 =— 1) 1. 378 3.512 

17 GE: (J XW = 2) 0. 272 0. 405 

资料 来 源 :SIPP。 


但 是 , 极 差 对 人 口中 每 个 人 应 答 上 的 不 完整 信息 非常 敏感 , 它 可 能 会 受到 
少数 极 值 的 极 大 影响 。 不 过 ,保密 性 原因 使 得 项 部 编码 收入 成 为 一 种 常见 的 做 
法 ,这 实际 上 会 掩盖 收入 的 极 差 。 一 个 更 普及 的 离散 度 测 量 是 分 布 的 二 阶 中 心 
和 矩 , 即 方差 V: 


一 二 2 yy? [3. 2] 


i=l 


如 果 每 个 人 都 得 到 一 个 固定 百分比 的 增 量 ,那么 收入 的 方差 将 会 增 大 。 比 
如 ,每 个 人 收入 固定 增加 50% 将 导致 方差 增加 1. 502 = 2. 25 倍 [4] ,尽管 收入 分 
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布 的 形状 仍 保持 不 变 。 表 3. 1 的 第 二 行 显示 ,尺度 改变 1. 5 情况 下 的 标准 差 OF 
差 的 平方 根 ) 为 原始 分 布 标准 差 的 1. 5 倍 。 右 偏 改 变 使 标准 差 增 大 近 3 倍 , 而 左 
偏 改 变 则 使 标准 差 减 小 约 40%。 表 3. 2 的 第 二 行 表明 ,收入 的 标准 差 从 1991 
年 的 3. 58 万 美元 增 大 到 2001 年 的 4. 53 万 美元 。 

如 果 想 在 不 受 收入 数量 影响 的 情况 下 对 收入 分 布 进行 比较 ,我 们 可 以 将 标 
准 差 ( 方 差 的 平方 根 ) 除 以 均值 得 到 变异 系数 c: 
= [3.3] 


Ss 

此 测量 对 收入 上 一 个 固定 的 百分比 变化 不 敏感 , 即 被 称 做 “尺度 无 关 性 ” 属 
ESIK 3. 1 的 第 三 行 显示 ,原始 分 布 和 尺度 改变 分 布 的 c 仍 为 0. 207。 不 过 ， 
它 在 经 过 纯粹 正 的 位 置 改变 (0. 172) 和 左 偏 改 变 (0. 148) 之 后 减 小 了 ,在 经 过 右 
偏 改变 之 后 反而 增 大 了 (0. 385) 。 因 此 ,变异 系数 描述 了 位 置 和 偏 态 改变 而 非 
尺度 改变 。 在 表 3. 2 的 第 三 行 中 ,1991 年 到 2001 年 从 0. 738 增 大 到 0. 900 表明 
美国 收入 分 布 的 中 心 位 置 以 及 右 偏 态 上 的 增 大 。 

除了 方差 之 外 ,我 们 也 可 以 用 对 数 方差 来 测量 不 平等 : 

v=) (log(¥)) = 2 >) dog yi — log 5>? (3. 4] 

由 于 对 数据 进行 了 对 数 转 换 , 此 测量 对 于 减少 严重 右 偏 态 分 布 可 能 很 有 
用 。 术 语 “ 方 差 * 有 误导 性 ,因为 在 方程 3. 4 中 , 离 差 平方 的 平均 值 并 不 是 关于 对 
数 转换 数据 的 均值 log(Cy) 的 ,而 是 关于 均值 的 对 数 log (7) 的 。 这 一 测量 仍然 具 
有 尺度 无 关 的 性 质 。 每 个 人 收入 上 50% 的 增 量 并 不 会 影响 到 量 v。 

由 于 上 面 提 到 的 原因 ,统计 上 更 为 自然 的 是 定义 对 数 的 方差 vi ,也 就 是 说 ， 
我 们 计算 对 数 转换 数据 的 方差 [6 这 一 测量 具有 与 对 数 方差 相 类 似 的 形式 , 除 
了 它 以 几何 均值 y* 代替 算术 均值 7 之 外 : 





n 


1 = 72 (log(25)) =F} (lgs Tox)? [3.5] 


y i=l 





尺度 无 关 性 质 也 可 以 直接 看 到 。 如 果 我 们 以 cy RE y” ,那么 log(cy;) = 
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log(c) 十 log(yi), 同时 , log(cy) = log(c) + log(y), 因此 ， 


ly log(cyi) — log (cy ) Pgs 1 yy log(c) + log(yi) — log(c) — log( y) f 
n i= i=1 


n 

因此 ,我 们 可 以 消去 log(c) 项 ,又 得 到 了 原初 的 w 。 所 以 ,对 全 部 人 口 的 收入 增 
加 一 个 固定 百分比 并 不 会 影响 对 数 的 方差 的 值 。v 和 wi 两 者 都 是 尺度 无 关 的 ， 
它们 之 间 的 恰当 选择 取决 于 函数 转换 (这 里 为 对 数 ) 在 特定 研究 中 是 否 重要 。 
不 过 ,由 于 上 面 提 到 的 原因 ,我 们 偏好 v. 

收入 对 称 分 布 及 其 4 种 改变 分 布 的 对 数 方差 v 如 表 3. 1 第 四 行 所 示 。 对 称 
收入 的 wv 为 0.049, 尺 度 改 变 后 该 值 并 未 被 改变 。 正 的 位 置 改变 实际 上 会 提高 
均值 以 下 收入 的 比值 yi/3 而 降低 均值 以 上 收入 的 该 比值 ,因此 ,w 值 下 降 为 
0.032。 左 偏 改变 也 会 以 类 似 但 更 强烈 的 方式 改变 比值 y;/3, v 降低 到 0. 026。 
相反 , 右 偏 改变 以 相反 方向 改变 比值 y;/3, v 升 高 到 0. 178。 随 着 因 位 置 和 形状 
都 改变 而 导致 对 数 方差 从 0. 790 上 升 到 0. 969( 见 表 3. 2 第 四 行 ) ,美国 家 庭 户 
收入 变 得 更 加 不 平等 。 

表 3. 1 MR 3. 2 第 五 行 显示 ,尽管 对 数 的 方差 vi 与 对 数 方差 v 大体 相似 ， 
但 vv 往往 略 大 于 vi ,分 布 越 是 右 偏 或 左 偏 ,差异 就 越 大 。 


基于 分 位 数 函 数 和 洛 伦 兹 曲线 的 不 平等 测量 


收入 分 布 的 分 位 数 经 常 被 用 于 收入 不 平等 的 官方 统计 和 经 济 学 分 析 。 比 
如 ,收入 分 布 底 部 1/5 和 顶部 1/5 之 间 的 比较 会 呈现 出 不 均匀 的 收入 分 布 。 非 
中 心 分 位 数 与 中 位 数 的 分 位 数 比 的 变化 ,经 常 被 用 来 显示 收入 分 布 或 财富 分 布 
形状 的 变化 趋势 。 

底部 敏感 的 分 位 数 比值 为 p5/p50, 而 项 部 敏感 的 分 位 数 比 为 p95/p50。 表 
3. 1 第 六 行 和 第 七 行 表 明 , 分 位 数 比 在 尺度 改变 后 仍 未 发 生变 化 ,但 对 位 置 改 
变 、 右 偏 改 变 和 左 偏 改 变 敏 感 。 比 如 , 随 着 p5/p50 上 升 而 p95/p50 下 降 , 正 的 
位 置 改变 会 减少 不 平等 。 表 3. 2 第 六 行 和 第 七 行 显示 ,p5/p50 之 比 在 1991 年 
(0. 194) 和 2001 年 (0. 190) 之 间 其 实 并 无 改变 ,而 p95/p50 大 幅度 地 从 2. 866 上 
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升 到 3. 232。 这 些 结果 意味 着 ,美国 收入 分 布 出 现 了 下 端 停滞 和 上 端 扩 大 的 
现象 。 

基于 分 位 数 的 不 平等 测量 更 为 灵活 。 研 究 者 可 以 根据 关注 的 主题 来 决定 
哪些 分 位 数 更 有 意义 。 比 如 ,如 果 想 通过 对 中 产 阶 级 的 关注 来 了 解 收入 分 配 的 
时 间 趋 势 ,那么 ,我 们 可 以 选择 p25 和 p75。 男 一 个 例子 是 教育 成 就 趋势 ,教育 
专家 经 常 根据 标准 化 测验 分 数 来 界定 成 就 的 类 别 。 根 据 2001 年 的 “全 国教 育 发 
展 评估 ”(National Assessment of Educational Progress) , 八 年 级 学 生 科 学 测验 
分 数 的 初级 成 就 水 平 是 143 分 , 为 全 国 科 学 测验 分 数 分 布 的 第 39 个 分 位 数 
(p39)。 熟 练 水 平 (170 分 ) 和 高 级 水 平 (208 分 ) 分 别 为 测验 分 数 分 布 的 第 69 个 
分 位 数 和 第 97 个 分 位 数 。 使 用 不 同时 间 点 上 这 些 特意 选取 的 分 位 数 而 不 是 任 
意 的 分 位 数 ,为 我 们 提供 了 监测 成 就 变化 趋势 的 一 种 合理 方法 。 同 时 ,这 一 灵 
活性 也 意味 着 ,我 们 并 没有 一 个 基于 分 位 数 的 唯一 测量 。 

有 关 收 入 不 平等 的 官方 统计 会 用 到 收入 “份额 * 的 概念 。 比 如 ,美国 普查 局 

告 说 ,2007 年 工资 收入 最 高 的 1% 的 人 拥有 总 收入 的 23%, 达 到 了 自 1913 年 

以 来 最 高 的 不 平等 水 平 。 收 入 份额 就 是 处 在 收入 的 某 一 特定 分 位 数 区 间 的 个 
体 或 家 庭 户 的 总 收入 所 占 的 比例 。 比 如 ,我 们 也 许 会 问 :“ 收 入 最 高 的 10% 的 总 
人 数 所 占 的 比例 是 多 少 ?” 

对 于 洛 伦 效 曲线 ， 


2 aIo 

Aadi 
这 就 是 最 低 收入 的 * 名 个 体 的 收入 所 占 比 例 。 因 此 ,点 p (p 二 s/n) 处 的 洛 伦 效 
曲线 直接 给 出 了 底部 100p% 的 个 体 或 家 庭 户 所 拥有 的 收入 份额 , 记 为 L(p)。 


洛 伦 兹 曲线 也 可 以 更 间接 地 用 于 达到 某 一 底部 份额 的 情况 。 注 意 ,具有 最 高 收 
入 的 ;名 个 体 的 收入 所 占 的 比例 可 写 为 : 


ly zs DaI = ye =] Diyo 
2 iy0 yw Iw 


L(s/n) = 
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BN 1—L((n—s)/n) =1 一 L(1 一 (s/n))。 因 此 ,一 般 而 言 ,最 高 100p% 的 个 体 
或 家 庭 户 所 拥有 的 份额 由 1 一 L(1 一 p) 给 出 。 

要 想得到 中 间 份 额 , 即 收 入 位 于 两 个 分 位 数 之 间 的 个 体 一 一 如 100p1L% 和 
100 pu % 的 个 体 一 一 的 总 收入 所 占 的 比例 ,我 们 就 取 上 限 份 额 和 下 限 份 额 之 间 
的 差 值 L(pu) 一 L(pL) 。 

K 3. 1 第 八 行 和 第 九 行 给 出 了 5 个 分 布 的 底部 和 顶部 1/5 的 份额 。 考 察 
底部 1/5 的 收入 份额 实际 多 大 程度 上 小 于 顶部 1/5 的 收入 份额 ,为 我 们 提供 
了 一 种 感知 不 平等 程度 的 直觉 方法 。1991 年 到 2001 年 的 10 年 期 间 , 底 部 五 
分 位 数 的 收入 份额 停滞 在 0. 048 到 0. 043 之 间 ,而 顶部 1/5 的 收入 份额 则 从 
0. 43 增加 到 了 0. 47( 见 表 3. 2 第 八 行 和 第 九 行 )。 洛 伦 效 曲线 可 被 用 来 查看 
各 种 分 位 数 (不 只 是 五 分 位 数 ) ,以 测量 不 平等 。 分 位 数 比 和 份额 都 具有 尺度 
无 关 的 性 质 。 

洛 伦 兹 曲线 在 时 间 上 的 变化 并 不 总 是 反映 不 平等 随时 间 变 化 的 清晰 模式 。 
当 两 个 时 期 的 洛 伦 兹 曲线 相交 时 ,我们 就 不 能 认为 某 个 时 期 比 男 一 个 时 期 更 不 
平等 。 我 们 将 在 第 5 章 中 对 洛 伦 效 曲线 的 相交 进行 更 详细 的 讨论 。 

基于 分 位 数 和 基于 份额 的 不 平等 测量 的 灵活 性 吸引 着 许多 研究 者 和 读者 。 
然而 ,这 一 灵活 性 是 有 一 定 的 代价 的 , 即 概要 数据 的 量 会 变 得 很 大 。 这 就 需要 
研究 者 根据 特定 的 研究 背景 来 选取 适用 于 整个 收入 分 布 的 一 套 灵 活 的 测量 或 
一 个 概要 测量 。 

基尼 系数 G 可 以 直接 根据 洛 伦 兹 曲线 加 以 界定 , 且 具 有 简单 的 图 形 表 
达 。 既 然 完全 平等 情况 下 的 洛 伦 效 曲线 以 对 角 线 表示 , 且 洛 伦 效 曲线 总 是 位 
于 对 角 线 处 或 其 下 ,那么 ,我 们 就 可 以 通过 计算 对 角 线 下 方 到 洛 伦 兹 曲线 上 
方 之 间 的 面积 来 测 得 到 平等 的 距离 。 两 个 面积 的 差 值 乘 以 一 个 因数 2, 就 得 
出 一 个 取 值 范围 为 0 到 1 的 不 平等 测量 。 越 大 的 基尼 系数 值 对 应 着 越 高 的 不 

图 3. 1 呈现 了 最 小 .最 大 和 两 个 其 他 基尼 系数 G 值 所 对 应 的 4 条 不 同 的 洛 
伦 效 曲线 。 图 3. 1(a) 对 应 完全 平等 的 情况 , G = 0, 此 时 ,每 一 个 个 体 都 得 到 相 
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同 份额 的 总 收入 。 图 3. 1(b) 和 图 3. 1(c) 对 应 一 些 个体 具 有 上 比 另 一 些 个 体 更 高 收 
入 的 情形 ,其 中 ,图 3. 1(b) 比 图 3. 1(c) 更 平等 。 图 3. 1(d) 中 的 洛 伦 效 曲线 展示 了 
不 平等 最 极端 的 情形 , 即 某 个 人 拥有 所 有 的 收入 而 (其 他 ) 2 一 1 个 人 根本 没有 收 
入 ,这 时 ,基尼 系数 所 测量 的 区 域 为 单位 正方 形 的 整个 右 下 三 角 , 使 得 G = 1。 


0 0.10.2 0.30.4 0.5 0.60.70.80.9 1 
p 


(a) 





0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.80.9 1 
p 


(b) 
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0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 
p 


Cc) 


0 0.10.2 0.30.4 0.50.6 0.7 0.80.9 1 
p 


(d) 


图 3.1 最 小 .最 大 和 两 个 其 他 基尼 系数 值 所 对 应 的 洛 伦 兹 曲线 


各 种 等 价 的 方程 可 用 来 计算 基尼 系数 。 令 L(p) 表 示 特 定 比例 p 处 的 洛 伦 
效 函 数 ,我 们 可 以 将 平等 曲线 和 洛 伦 兹 曲线 之 间 的 面积 表达 为 平等 线 下 方面 积 
A 和 洛 伦 兹 曲线 上 方面 积 B 之 间 的 差 值 。 因 此 ,表达 基尼 系数 的 一 个 方法 是 写 
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出 以 下 方程 : 
G = 2(A—B) = 2(| pdp —|'L¢p)dp ) = 2) | pL) Jap (3. 6a] 


但 是 ,以 总 体 yis e yn 中 所 有 可 能 收入 对 的 差 值 形式 来 表达 基尼 系数 方 
程 也 是 可 行 的 , 即 所 有 n(n 一 1)/2 个 可 能 收入 对 之 间 平 均 差异 的 一 半 , 并 以 平均 
收入 加 以 标准 化 : 





lyi — y; |/(n@—1)/2) lyi — yi | 
7 43 


l ISJ <iSn — ] 久 三 二" 
2 y n(n—1)¥ L3. 6b] 





G= 


这 个 方程 清楚 地 表明 基尼 系数 的 最 小 值 为 0, 此 时 ,每 个 人 具有 相同 份 
额 的 总 收入 。 另 外 , 当 一 个 人 具有 全 部 收入 时 ,取得 最 大 值 1, 所 以 G 的 取 
值 范围 为 L0, 1]. 

表 3. 1 第 十 行 显示 .收入 的 对 称 分 布 的 基尼 系数 为 0. 117。 在 第 二 列 
中 ,G 在 纯粹 位 置 移动 的 情况 下 有 所 下 降 (0. 097)。G 是 尺度 无 关 的 ,因为 
它 基 于 本 身 就 是 尺度 无 关 的 洛 伦 兹 曲线 ,如 第 2 章 中 所 指出 的 那样 。 尺 度 
无 关 性 根据 方程 3. 6b 也 看 得 很 清楚 ,因为 平均 收入 53 出 现在 分 母 中 。 左 偏 
变化 将 G 减 小 到 0. 081, 而 右 偏 变化 则 将 G 增 大 为 0. 219。 美 国 收 入 的 G 从 
1991 年 的 0.385 上 升 到 2001 年 的 0.424, 反 映 了 位 置 和 形状 改变 (尽管 不 是 
尺度 改变 ) 。 


根据 社会 福利 函数 推导 得 到 的 不 平等 测量 


现在 ,我们 介绍 如 何 使 用 社会 福利 函数 来 得 到 不 平等 测量 。 根 据 阿 特 金森 
的 研究 ,一 个 由 n 名 个 体 组 成 的 社会 的 收入 成 分 可 被 合并 成 一 个 维 排列 
(y1，*……，yn) ,其 中 ,yi 表示 第 i 名 个 体 的 收入 水 平 。 社 会 福利 函数 是 将 一 个 值 
W(y1，…，yn) 赋 予 每 一 个 可 能 的 收入 n 维 排列 的 函数 ,这 个 值 代 表 了 该 社会 
在 取得 特定 的 收入 nn 维 排列 情况 下 的 集体 福利 。 因 此 ,如 果 W(y1,…，yn) 之 
Wis eo Ja), 那么 ,对 于 该 社会 全 体 而 言 ，(y1，…，yn) 就 被 认为 是 比 
(His ts Fn) BATRA. 
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会 福利 函数 的 性 质 可 被 用 来 反映 社会 性 的 平等 和 公平 目标 (Deaton， 
ne 福利 函数 强加 这 样 一 个 属性 , 即 更 平等 的 分 配 被 
认为 优 于 更 不 平等 的 分 配 ,因此 ,在 一 个 社会 的 总 收入 保持 不 变 的 情况 下 ,社会 
福利 在 收入 被 平等 分 配 时 达到 最 高 。 同 样 ,我 们 也 可 以 构造 一 个 社会 福利 函 
数 ,使 得 社会 福利 在 每 当 任意 一 名 个 体 变 富 而 并 没有 人 变 穷 的 情况 下 ( 帕 累 托 
改进 ) 都 会 增加 ,这 个 性 质 被 称 做 “公平 偏好 ”。 

为 简单 起 见 , 社 会 福利 函数 被 都 假定 是 个 体 效用 的 一 个 合计 ,因此 , 它 有 一 
个 简单 的 加 法 形式 Won = yw) 一 DUO) 。 这 里 ,U 是 一 个 函数 , 意 在 反 
映 每 个 将 其 与 一 个 特定 收入 水 平 联系 起 来 的 效用 ,也 被 称 做 “社会 效用 函 
数 "。 此 函数 被 假定 对 于 所 有 的 个 体 而 言 都 是 相同 的 。 我 们 将 把 注意 力 集中 在 

以 这 一 方式 构建 的 社会 福利 函数 上 ,U 在 这 里 被 假定 是 单调 非 减 的 和 四 形 的 。 
这 些 假定 都 是 情理 之 中 的 :单调 性 确保 公平 偏好 性 质 得 以 维持 ; 叫 形 假定 是 个 
常见 的 假定 ,相当 于 边际 效用 递减 假定 。 

在 这 些 假定 之 下 ,社会 福利 函数 呈 思 形 ,意味 着 与 两 个 收入 维 排列 的 加 
权 平 均值 相对 应 的 社会 福利 ,至 少 和 与 每 个 排列 相 联系 的 社会 福利 的 加 权 平均 
值 一 样 大 。 在 一 个 富 人 和 一 个 穷人 之 间 进 行 简单 的 收入 转移 时 ,只 要 这 两 人 之 
Sa ni 这 就 是 最 初 由 首尔 顿 提出 的 “转移 
PERUI” (Dalton, 1920) ,我 们 将 在 第 4 章 中 进一步 讨论 。 

一 旦 确立 了 社会 福利 函数 的 具体 形式 ,就 有 可 能 引入 基于 “平等 分 配 的 等 
值 收 入 "这 一 概念 的 不 平等 测量 。 这 被 定义 成 每 一 个 体 所 得 到 的 收入 y* 会 将 
社会 福利 提高 到 与 实际 相同 的 水 平 , 即 WGy*，…,y* ) 一 Wis =s yn) 的 解 ， 
或 者 Uy* ) 一 十 >)UCy) 的 解 。 在 对 社会 效用 函数 U 进行 仿 射 变换 的 情况 
下 ,平等 分 配 的 等 信 收 入 是 恒定 的 ,这 意味 着 ,如 果 我 们 通过 选取 党 数 wu、 0) 
和 对 社会 效用 函数 U 得 到 局 (y) = aU Cy) 十 6 来 定义 一 个 新 的 社会 效用 函数 
U, 那 么 ,y* 对 U 和 口 两 者 而 言 是 相同 的 。 





D 仿 射 变换 是 一 种 二 维 坐标 到 二 维 坐标 之 间 的 线性 变换 。 这 种 转换 可 保持 二 维 图 形 的 * 平 直 
性 "。 一 一 译 者 注 
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也 就 是 说 ,平等 分 配 的 收入 并 不 会 大 于 平均 收入 。 通 过 平等 分 配 可 得 的 收入 ， 
从 社会 福利 的 角度 看 ,使 社会 变 得 更 富裕 。 那么 ,比值 y* /7 可 被 视 为 一 个 平等 
测量 。 如 果 此 比值 接近 1, 那 么 ,社会 就 可 以 重新 平等 地 分 配 其 所 有 可 得 的 收 
入 ,并 大 致 得 到 相同 水 平 的 社会 福利 。 如 果 此 比值 为 40%, 那 么 ,社会 可 以 通过 
将 总 收入 的 现 值 减少 40% 并 平等 地 将 其 分 配 来 实现 完全 平等 。 平 等 分 配 所 有 
收入 并 实现 相同 的 社会 福利 所 需要 的 收入 减少 越 少 ,社会 就 越 接近 平等 。 阿 特 
金森 介绍 了 使 用 量 1 — y* /5 来 测量 不 平等 的 思路 。 这 个 量 也 取 0 到 1 之 间 的 
值 ,其 中 ,0 表示 完全 平等 。 值 越 大 表明 越 不 平等 ,但 这 取决 于 社会 效用 函数 ,该 
值 不 可 能 为 1。 

经 效用 函数 仿 射 转换 得 到 的 y* 的 不 变性 性 质 ,直接 导致 了 相应 的 不 平等 
测量 具有 相同 的 性 质 。 这 很 有 吸引 力 , 因 为 通过 尺度 改变 或 变化 来 调整 社会 效 
用 函数 不 应 对 不 平等 测量 造成 影响 。 最 后 一 个 强加 给 我 们 的 不 平等 测量 的 关 
键 性 质 就 是 收入 尺度 无 关 性 , 即 如果 对 于 一 个 正 的 常量 ,以 (cy sts cyw) 来 取 
代 收 入 的 维 排列 ,那么 ,不 平等 的 水 平 不 应 被 改变 。 当 我 们 将 这 一 条 件 强加 给 
不 平等 测量 时 ,社会 效用 函数 的 可 能 情形 就 被 减少 成 一 组 形式 为 UCy) = y 或 
U(y) = log(y) 的 社会 效用 函数 的 仿 射 转换 ,这 里 ,c 为 某 个 小 于 或 等 于 1 的 数 
值 。 我 们 习惯 上 用 参数 e = 1 一 c 而 不 是 < 来 表达 使 用 仿 射 转换 形式 Ue) = 
(> 一 1)/G1 一 e) 的 社会 效用 函数 族 ,这 里 ,e 被 限定 为 非 负数 。 请 注意 , e= 1 
的 情形 在 上 述 定义 中 未 被 明确 定义 ,但 是 , 随 着 se 117), 这 一 规则 使 我 们 能 够 
HUO) = logy) 作为 这 一 族 的 极限 情形 ,因此 ,我 们 用 符号 Ui(y) 来 表示 这 一 
特殊 情形 。 请 注意 ,对 于 e 宇 1, Us(0) 的 值 并 未 被 明确 定义 ,但 这 种 情形 确实 落 
入 极限 , 随 着 y 趋 近 于 0, Us (y) 的 值 趋 近 于 一 oo, 因 此 ,如 果 任何 单个 的 个 体 都 
没有 收入 ,社会 可 被 视 为 正 处 在 一 个 极其 危险 的 状态 之 中 。 既 然 一 些 人 没有 收 
入 可 以 是 一 个 经 常 发 生 的 事情 ,那么 ,这 一 取 值 范围 上 e 值 的 使 用 可 以 被 证 明 是 
成 问题 的 。 

我 们 已 经 得 到 了 具有 若干 可 取 性 质 的 社会 福利 函数 族 : 
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这 里 ,参数 e 的 值 为 非 负数 ,同时 ,我 们 将 Wi 理解 成 工 > log). 参数。 被 
定义 为 不 平等 天 恶 参数 ,读者 很 快 就 会 明白 这 么 定义 的 理由 。 这 一 参数 的 选 
择 意 在 反映 作为 整体 的 社会 行为 。 一 旦 确定 了 不 平等 厌恶 参数 的 选择 ,通过 
求解 方程 UCy* ) = SOU. Con) ,就 可 以 简单 而 直接 地 得 到 平等 分 配 的 等 值 


> 1x 1/(1—e) ; 
收入 ,同时 得 到 解 >* = (A)  ”“”。 这 里 应 当 强 调 的 是 ,每 选取 一 个 


不 平等 厌恶 参数 6, 都 会 得 到 一 个 不 同 的 y* 值 ,因此 ,为 了 避免 混淆 ,我 们 可 
以 用 符号 y* (6) 来 表示 这 个 量 。 当 二 0 时 ,平等 分 配 的 等 值 收入 为 平均 收入 
3, 恰好 与 社会 福利 价值 相符 。 因 此 ,对 于 那些 较 小 的 不 平等 天 恶 参数 取 值 ， 
任何 不 改变 总 收入 的 收入 不 平等 都 对 社会 福利 具有 最 小 的 影响 。 对 于 等 于 
1 时 这 一 特例 ,我 们 会 得 到 几何 均值 y* (1) = ( ][ yw) .推导 ( 见 发 布 在 作 
者 网 站 上 的 第 3 章 附录 A) 表 明 , 随 着 不 平等 厌恶 参数 。 的 上 升 , 平 等 分 配 的 
等 值 收入 y (@) 会 下 降 。 如 果 单个 个 体 的 收入 为 0 且 e> 1, 那么 ,中 -= 上 的 
指数 就 是 负 的 @, 同 时 ,我 们 可 以 将 y* (6) 的 表达 式 解释 为 0, 尽管 这 是 在 将 
收入 向 量 视 为 包含 所 有 正 值 的 收入 向 量 序列 的 一 个 极限 的 情况 下 取得 
的 值 。 

此 时 ,对 于 s > 0 的 每 一 个 可 能 取 值 ,我 们 可 以 介绍 阿 特 金森 不 平等 指数 族 
A ,它们 是 与 所 考虑 的 社会 效用 函数 的 具体 形式 相 联系 的 阿 特 金森 测量 。 这 些 
测量 可 以 根据 y* (e) 的 表达 式 直接 得 到 ,并 写成 以 下 形式 ， 





Ce mia tte Ee? (x) (3. 7] 


这 里 ， EF l, 而 在 e=1 的 特殊 情况 下 ,我 们 有 : 


AiCyis “tts Yn) = 1— (Th o)" 





© 即 此 时 1 一 es 小 于 0。 一 一 译 者 注 
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现在 ,e 为 什么 会 被 定义 成 不 平等 厌恶 参 数 就 变 得 很 清楚 了 。 在 阿 特 金 森 
的 方法 中 ,被 定义 成 1 一 y* (se)/7 的 不 平等 会 随 着 参数 e 的 上 升 而 增 大 。 如 果 e 
非常 接近 于 0, 那 么 ,无 论 收 入 被 如 何 分 配 , 阿 特 金森 指数 都 会 取 一 个 接近 于 0 
的 数值 ,同时 ,社会 可 被 描述 成 对 收入 不 平等 漠不关心 。 对 于 两 个 具有 完全 相 
同 的 收入 分 配 的 不 同 社会 ,第 一 个 社会 具有 参数 sl 而 第 二 个 社会 具有 参数 ez ， 
He <e, 那么 ,第 二 个 社会 将 会 被 认为 其 不 平等 更 严重 , 且 可 被 描述 成 更 厌恶 
不 平等 差异 。 

考虑 阿 特 金森 指数 的 可 能 取 值 范围 很 重要 。 在 下 端 , 当 收 入 在 整个 人 口 
中 被 平等 分 配 时 ,对 于 所 有 的 i, 有 yi = y, 同时 ,所 有 的 阿 特 金 森 指 数 都 取 0 
值 ; 在 上 端 ,指数 不 能 超过 1。 对 于 e <1, 当 某 一 个 体 拥有 所 有 的 收入 时 ,就 
出 现 了 最 大 的 不 平等 ,同时 ,我 们 得 到 A。 = 1 一 二 % UR n KH, e DiR 
接近 于 0, 那 么 ,这 一 数值 将 接近 于 1。 如 果 e 宇 1, 可 使 As 接近 于 由 某 一 个 体 
得 到 了 几乎 所 有 的 收入 而 其 余人 口 则 分 享 剩 下 部 分 的 收入 的 向 量 所 要 求 的 
取 值 。 

表 3. 1 第 十 一 行 记录 了 A! ?的 值 。 对 于 收入 的 对 称 分 布 , 该 值 为 0. 011, 它 
在 尺度 改变 之 后 仍然 相同 。 正 的 位 置 改变 实际 上 提高 了 均值 以 下 收入 的 比值 
yi/3, 而 降低 了 均值 以 上 收入 的 该 比值 ,因此 降低 了 由 阿 特 金森 指数 (0. 007) 所 
测 得 的 不 平等 。 同 样 , 左 偏 改 变 也 改变 了 比值 y;/3, 将 A12 减 小 到 0. 006。 相 比 
而 言 , 右 偏 改变 也 改变 了 比值 y;/3, 并 将 AM? SE KEI 0. 038。 提 高 不 平等 厌恶 会 
导致 更 大 的 不 平等 ,如 表 3. 1 第 十 二 行 和 第 十 三 行 所 示 , 其 中 ,e 从 s 一 1 到 e 一 2 
的 加 倍 导致 不 平等 也 提高 了 两 倍 多 。 表 3. 2 第 十 一 行 到 第 十 三 行 中 取 自 SIPP 
的 真实 数据 显示 ,Al1/2 从 1991 年 的 0. 123 上 升 到 2001 年 的 0. 149。 对 于 这 两 年 
mA A: 的 值 几乎 是 Al 的 值 的 3 倍 。 


根据 信息 理论 发 展 得 到 的 不 平等 测量 


fE EEE EARR E ER R EKR N ER R RBE 
变量 ) 的 随机 度 。 术 语 “ 炉 ”表达 了 不 确定 性 。 如 果 我 们 考虑 一 个 实验 ,其 中 的 
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一 个 随机 变量 能 够 以 概率 pis cvs px 取 n 个 可 能 值 之 一 ,那么 ,与 该 分 布 相 联 


H(pi, wes Pn) =— 2 pilogz (pi) 


FATES AE SUEY 5 FR A 2 作为 对 数 的 底 。 我 们 可 以 用 任意 的 底数 来 定义 
焙 , 它 只 具有 将 全 部 入 都 乘 以 一 个 常数 因数 的 效果 ,也 就 是 说 ,如 果 我 们 转 而 使 
用 自然 对 数 ,那么 以 上 定义 的 所 有 炉 都 被 乘 以 log(2)。 如 果 某 一 结果 是 确定 
的 ,因此 对 于 某 一 个 i, 有 pi = 1 (使 所 有 其 他 概率 都 为 0) ,那么 ,此 处 的 炉 就 
为 0。[8] 

最 简单 的 例子 也 许 就 是 投 硬币 实验 的 情况 。 这 里 ,有 两 个 可 能 的 结果 ,每 
DARMEN 1/2 BEY : 


H(1/2, 1/2) =— F loge (1/2) — F loge (1/2) est 


这 个 例子 解释 了 为 什么 我 们 以 2 ERARE. HBB A a SEA FP AE E 
进行 编码 所 需要 的 字 节 数 。 此 处 ,包含 两 个 可 能 结果 的 实验 结果 只 需要 一 个 字 
节 。 我 们 可 以 认为 , 炉 是 在 测量 以 投 撕 硬 币 作为 基本 单位 的 分 布 的 随机 性 。 更 
一 般 地 来 说 ,我 们 可 以 考虑 一 个 两 类 结果 的 实验 ,其 中 ,结果 出 现 的 概率 为 p 和 
1—p, 这 里 ,p 为 0 到 1 之 间 的 任意 数字 。 此 实验 被 定义 为 伯 努 利 试验 。 此 人 处 
RIRIH FRAR tH : 


H(p, 1— p) =— plog: (p) — (1 — p)log: (1 — p) =— loge ( pP 1 — p)!-*) 


1 FD I #2 8» IRAAK RIR. EEH , X FRI 
一 枚 分 布 不 均匀 的 硬币 的 情况 , 当 正 面 朝 上 的 概率 为 1/2 EF, AB ON RE) RAR 
最 大 。 

如 果 X 是 一 个 以 概率 is vos Pn Aen 个 可 能 值 的 随机 变量 ,那么 ,我 们 可 
DURE HC pis sts pn) 定义 为 X ASN FPR A 也 (X)。 炉 只 取决 于 实验 中 各 
类 结果 出 现 的 概率 ,指派 给 这 些 结果 的 特定 标签 本 身 并 无 任何 影响 。 因 此 ,与 
结果 出 现 的 概率 为 pis o Pn 的 实验 相对 应 的 和 并 不 会 受到 对 结果 (因此 也 是 
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概率 ) 进 行 重新 排序 的 影响 。 

WGA 1 EE DO ,我们 在 这 里 介绍 其 中 的 一 些 。 一 个 关键 的 性 质 是 独 
立 条 件 下 的 可 加 性 。 我 们 来 考虑 两 个 实验 :在 第 一 个 实验 中 ,我 们 观测 到 一 个 
Wi 五 (X) 的 随机 变量 X, CES PSE, FRAT LI BO H(Y) 的 Y。 那 
么 ,在 X 和 YY 相互 独立 的 情况 下 观察 到 (X, Y) 对 的 组 合 实验 中 ,(X, YR A 
KE MAM 

H(X, Y) = H(X)+ H(Y) 

为 了 领会 这 一 点 ,设想 X 以 概率 pi ets pm 来 取得 值 1, …， m, Y 以 概率 
qis to dn 来 取得 值 1,，…，, n, ABA, (X, Y) 对 就 以 概率 pig) 取得 值 (i, j)。 因 
此 ,对 应 此 组 合 实验 的 炉 由 下 式 给 出 : 


H =— Ù., pigilog(piq)) =— 5,. pias (log(pi) + loga) 
=— >), > pigilog(pi) +— 3), >) , pias log(q;) 
=— 2 ;pilog(pi) >) gj +— Dd) ,ailog(qi) 2 .pi 
= 一 > pilog(pi) — 2 2 log(q) = H(X)+ H(Y) 


FH FRE DT HE ES A & > PS BER RE F ce SY) PA FR TT 
BE SH EAS Te] BC RA Oe A KARA. Heo. one H ESER pi. e 
Pn FAXT OLE Re, Ae HORE A pi 被 分 成 了 两 部 分 ,比如 , pi = qi tri. 
ABA ej HS Hn : 
H(p, sets Dis qi tris Pits ttt Pn) < HO, “t, Pimi» Gis Tis Pitls ***s Pn) 

eS A PE MERILO] , A PER) AR pis es pn Mq e 
gn 以 及 一 个 常数 E [0，1] ,我 们 有 : 

H(A bis s Pn) HAA, s Gn) SAH (pis s pn) 

+1 —A)H(gil natal qn) 


这 一 不 等 式 有 如 下 解释 。 以 下 概率 的 分 布 : 
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ACP; eS Pn) 十 (1 一 人 )(ql， wets Qn) = pi +1—-Aq, et Apn + AA an) 


FY BEAT EAL Bs RET AO A pis o Pa 所 界定 的 概率 为 
A 的 分 布 和 91, …， gn 所 界定 的 概率 为 1 一 4 的 分 布 进行 抽样 所 得 到 的 。 这 被 定 
义 为 这 两 个 分 布 的 混合 。 那 么 ,不 平等 表达 的 是 两 个 分 布 的 混合 的 粹 至 少 与 这 
两 个 分 布 各 自 的 粹 的 相应 混合 一 样 大 。 

AT Rw HA 

ERREARI AMERRE n 个 结果 之 间 不 均匀 分 配 程度 的 量 , 屠 
么 ,我 们 自然 也 可 以 用 相同 的 思路 来 量化 总 收入 在 某 一 人 口中 不 均匀 分 布 的 程 
E. 假定 人 口中 个 体 的 收入 为 mm ，…， yw, 因此 ,个 体 i 的 收入 份额 为 s; = 
yi/ny， 且 这 些 份额 相 加 等 于 1, 即 ST" si = 1。 我 们 将 这 些 份 额 当成 概率 来 处 
BE EE H =- 3)" silog si) 定义 成 一 个 收入 不 平等 测量 (请 注意 ,这 里 我 们 
使 用 了 自然 对 数 )。 

ATM MAF EME 

介绍 基尼 系数 时 ,我 们 测量 了 洛 伦 兹 曲线 和 平等 线 ( 它 对 应 于 完全 平等 的 
情形 ) 之 间 的 面积 。 采用 类 似 的 方式 ,我 们 可 以 计算 在 每 个 人 获得 相同 收入 份 
额 这 一 完全 平等 的 情况 下 ,得 到 的 焙 与 实际 收入 份额 情况 下 的 焙 之 间 的 差 。 所 
得 的 测量 被 定义 为 “ 泰 尔 不 平等 指数 ”: 





T= HG =, 1/0 — HG1, 1) = 一 六 A tog(4)+ X silog) 
i=] i=l 
[3. 8a] 
: 1 
T= > si| logc >— log( 3) | 3. 8b] 
T= L5 2 [tog(2) | [3. 8c] 


该 指数 的 这 3 个 表达 式 是 等 价 的 .L10] 方 程 3. 8c 表明 ,收入 与 平均 收入 的 
比值 y;/3 是 隐 含 在 该 定义 中 的 基本 元 素 。 与 在 对 数 方差 和 阿 特 金森 指数 中 的 
情形 一 样 ,收入 比 确保 了 泰 尔 不 平等 指数 是 尺度 无 关 的 。 

既然 泰 尔 不 平等 指数 是 完全 平等 情况 下 的 箭 减 去 实际 测 得 的 焙 , 那 么 其 
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取 值 就 位 于 区 间 [0，log(z)] 上 ,其 中 ,0 表明 完全 平等 ,而 log(n) 表 明 极 其 不 
平等 (一 个 人 拥有 全 部 收入 )。 因 此 ,尽管 录 在 所 有 概率 都 相等 的 情况 下 取得 
最 大 值 ,但 这 对 应 着 泰 尔 不 平等 指数 的 最 小 值 , 此 时 ,所 有 的 收入 份额 都 
相同 。 

炳 的 四 函数 性 质 直接 导致 泰 尔 不 平等 指数 极 具 吸 引力 的 一 个 性 质 。 设 想 
有 两 种 政策 , 某 个 人 口 将 依据 它们 来 分 配 总 收入 。 在 第 一 种 政策 下 , 令 分 配 比 
例 为 bis s pn; 在 第 二 种 政策 下 ,这 些 比例 记 为 g1，…, gs。 那么 ,在 第 一 种 
政策 下 ,个 体 i 得 到 比例 为 pi 的 总 收入 ;而 在 第 二 种 政策 下 ,这 一 比例 则 为 gi。 
现在 ,我 们 可 以 用 这 两 个 基本 政策 下 的 平均 比例 来 定义 一 个 新 的 分 配 政策 , 因 
此 ,个 体 i 得 到 的 收入 比例 为 Chi + gs) 。 粹 的 四 函数 性 质 会 确保 这 一 组 合 政 
策 下 的 泰 尔 不 平等 指数 不 大 于 两 种 政策 下 各 自 泰 尔 指数 的 平均 值 ; 


了 组 合 政策 < 5 (Tage + 了 政策 2 ) 


更 一 般 而 言 ,我 们 可 以 建构 两 种 政策 的 加 权 平 均值 。 取 任 一 取 值 范围 为 0 
到 1 的 常数 ,并 按照 政策 1 和 政策 2 下 所 得 份额 的 加 权 平 均值 ,将 收入 分 配给 每 
一 个 个 体 , 也 就 是 说 ,个 体 ; FSB UA RA Api + AD Gi o KiK ET BCE Ii 
确保 不 平等 的 泰 尔 测量 永远 不 大 于 这 两 种 政策 下 ,各 个 泰 尔 不 平等 测量 的 相应 
加 权 平 均值 : 


了 组 合 政策 委 A 了 政策 1 十 (1 一 入) 了 政策 2 。 


表 3. 1 第 十 三 行 给 出 了 收入 对 称 分 布 及 其 4 种 改变 分 布 的 泰 尔 不 平等 指 
数 。 该 指数 在 对 称 分 布 收入 情形 中 取 值 为 0. 022, 与 尺度 改变 分 布 情况 下 的 值 
相同 。 该 指数 在 正 的 位 置 改变 和 左 偏 改 变 之 后 降低 ,但 在 右 偏 改 变 之 后 却 升 
高 。 同 样 , 表 3. 2 第 十 三 行 显示 , 泰 尔 不 平等 指数 从 1991 年 的 0. 244 上 升 到 
2001 年 的 0. 310。 

以 炉 和 泰 尔 指数 表示 的 收入 份额 的 对 数 转 换 只 是 转换 族 中 的 一 个 例子 。 考 
维尔 用 下 述 焙 更 一 般 性 的 定义 介绍 了 修正 的 信息 理论 测量 族 (Cowell，2000) : 
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GE =z + Peay 1] [3. 9] 
这 里 ,0 为 敏感 性 参数 ,其 取 值 可 以 是 任意 实数 。0 越 是 为 正 ,该 指数 就 越 是 对 分 
布 项 部 的 收入 差异 敏感 , 故 被 定义 为 “顶部 敏感 的 ”广义 炉 指数 。 同 样 ,9 越 是 为 
负 ,该 指数 就 越 是 对 分 布 底部 的 差异 敏感 , 故 被 定义 为 “底部 敏感 的 ”广义 信 指 
数 。 与 泰 尔 指数 的 情况 一 样 , 广 义 炉 也 是 尺度 无 关 的 。 

4O= 1, 0 二 0 或 9 二 2 时 ,根据 方程 3.9 可 以 推导 出 一 些 特殊 形式 (请 见 
发 布 在 作者 网 站 上 的 第 3 章 附录 B)。 当 0 = 1 时 ,我 们 会 得 到 泰 尔 指数 : 


GE; = LX (#)iog(#)= TO 





当 0 = 0 时 ,我 们 有 
= yi 
ni 


这 被 称 做 “平均 对 数 离 差 *。 当 0 二 2 时 ,我 们 得 到 GE2 = c2/2, 即 变异 系数 平方 
的 一 半 。92 的 其 他 特殊 取 值 通常 都 与 熟悉 的 不 平等 测量 有 关联 。 当 0 = 一 1 时 ， 
J SORA 2 Te MACREHE RIESE. HO O< LAYS” iS BR ARTE AL 
有 常见 的 关系 。 对 于 阿 特 金森 族 中 的 每 一 个 指数 (以 不 平等 厌恶 参数 来 定义 )， 
广义 炉 族 中 都 有 一 个 等 价 指 标 。 不 过 ,由 于 0 可 以 取 (0, 1) 区 间 之 外 的 任意 数 
值 ,所 以 ,相反 的 情况 并 不 成 立 。 

表 3. 1 第 十 三 到 第 十 七 行列 出 了 广义 焙 的 4 种 特殊 情形 。 在 第 十 四 行 中 ， 
泰 尔 指数 与 0= 1 时 的 GE: 相同 。 随 着 0 在 第 十 四 行 到 第 十 六 行 中 从 1 下降 到 
0 和 一 1, 我 们 看 到 ,收入 对 称 分 布 及 其 4 种 改变 分 布 的 GE, 值 在 不 断 上 升 。 在 
第 十 七 行 中 ,我 们 看 到 ,GEz Wy BES RCP Ti IAB (02/2). SORTER BE AE oh 
后 仍然 相同 。 以 广义 焙 测 量 的 美国 收入 不 平等 显示 在 表 3. 2 第 十 四 行 到 第 十 七 
ATP WERS SOY EY Ta A i A De] BUR OMS. HEM. GK 





中 ”此 方程 略 有 改动 ,去 掉 了 原文 方程 等 号 左边 字母 G 的 标记 1。 一 一 译 者 注 
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注 分 布 的 中 间 部 分 的 GE1 一 工 相 比 ,底部 敏感 的 GE-1 不 但 表明 1991 年 和 
2001 年 的 不 平等 程度 更 大 ,而 且 显 示 出 这 两 年 间 不 平等 的 增长 速度 也 更 快 。 

广义 箭 测量 具有 很 多 有 用 的 性 质 。 但 最 重要 的 是 ,广义 精 能 足够 灵活 地 以 
满足 各 类 具体 实质 需要 和 符合 不 平等 测量 的 所 有 基本 原则 的 方式 ,来 刻画 不 平 
等 的 特征 。 


适用 于 含 非 正 数 取 值 变量 的 概要 不 平等 测量 


迄今 为 止 ,我 们 一 直 将 收入 或 其 他 资源 作为 不 包含 负 值 和 零 值 的 情况 来 对 
待 。 许 多 经 验 研 究 都 关注 正 值 收入 的 分 布 , 因 为 负数 收入 (比如 ,由 于 资本 损 
失 ) 或 没有 收入 的 人 口 比例 通常 非常 小 。 经 验 研究 工作 中 的 做 法 是 删除 那些 包 
含 负 值 或 零 值 的 案例 。 对 于 以 资产 净值 (总 资产 减 去 总 负债 ) 来 衡量 的 财富 而 
言 , 情 况 变 得 十 分 不 同 。 没 有 正 的 总 资产 净值 的 家 庭 户 的 比例 很 大 (根据 SIPP 
数据 ,2001 年 时 为 17%)。 比 如 , 因 助 学 贷款 所 导致 的 负 资 产 净值 源 于 生命 周期 
差异 。 人 们 通过 承担 信用 卡 债务 来 均衡 消费 。 房 产 市 场 泡沫 和 随后 的 危机 能 
够 大 大 降低 一 处 房产 相对 于 抵押 贷款 的 价值 ,从 而 导致 负 的 房产 净值 。 金 融 市 
场 危机 可 以 大 大 缩减 人 们 持 有 的 股票 与 债券 投资 的 价值 。 因 此 ,总 价值 为 负 值 
或 零 值 的 家 庭 户 太 重要 了 ,不 能 删除 。 

这 里 所 回顾 的 不 平等 测量 并 不 都 能 处 理 收入 变量 的 负 值 或 零 值 ;使 用 对 数 
函数 的 不 平等 测量 不 能 处 理 非 正 数 取 值 , 除 GE: 9b. Bal Re ae BRA BA SC 
族 的 一 些 测量 也 能 处 理 非 正 数 取 值 。 方差 .变异 系数 、 基 尼 系 数 和 基于 分 位 数 
的 测量 都 可 以 用 来 考察 这 些 情形 下 的 财富 不 平等 。 

根据 1991 年 和 2001 年 的 SIPP 财富 数据 , 表 3. 3 给 出 了 可 以 处 理 负 资 产 净 
值 和 零 资 产 净值 的 不 平等 测量 。 负 资产 净值 的 家 庭 户 比例 为 8. 4%, 零 资产 兆 
值 的 家 庭 户 比例 为 4. 4% ,这 样 ,1991 年 时 没有 正 资产 净值 的 家 庭 户 比例 共计 为 
12.8%, 2001 年 的 相应 数值 分 别 为 12. 9%、4. 3% 和 17. 1%。 极 差 和 标准 差 在 
这 10 年 间 大 大 上 升 ,反映 出 2001 年 资产 净值 上 的 分 化 要 比 1991 年 大 得 多 。 变 
异 系数 从 1.73 上 升 到 8. 84, 主 要 反映 了 方差 的 增长 (尽管 以 一 个 很 小 的 因数 对 
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< 进行 调整 的 情况 下 的 资产 净值 中 位 数 达 到 了 6303 美元 )。 分 位 距 p95 到 p5 
上 升 了 几乎 一 半 。 请 注意 ,p5 是 个 负 值 ,因为 超过 5% 的 家 庭 户 在 这 两 年 中 的 
资产 净值 都 是 负 的。 我 们 没有 用 基于 分 位 数 的 偏 度 , 因为 近 4% 的 家 庭 户 的 资 
产 净值 为 0, 这 使 得 资产 净值 分 布 呈 现 出 多 峰 样 态 。 底 部 20% 的 家 庭 户 的 资产 
净值 之 和 在 这 两 年 都 为 负 值 ( 负 资 产 净值 之 和 大 于 正 资产 净值 之 和 ) ,导致 1991 
年 的 份额 为 一 0. 010，2001 年 的 份额 为 一 0. 018. TRB 20%% 的 家 庭 户 的 份额 从 
0. 699 上 升 到 0. 766 ,基尼 系数 也 从 0. 700 上 升 到 0. 769。 





不 平等 测量 1991 
与 概率 分 布 相 联系 
1 R( 极 差 )(1000 美元 ) 6850 
2 JV (标准 差 )(1000 美元 ) 200 
3 c( 变 异 系数 ) 1. 730 
基于 分 位 数 函 数 和 洛 伦 兹 曲线 
6 p95/p50( 分 位 数 距 )(1000 美元 ) 463 
8 底部 1/5 的 份额 一 0.010 
9 顶部 1/5 的 份额 0. 699 
10 G( 基 尼 系 数 ) 0. 700 
负 值 的 百分比 8.4 
零 值 的 百分比 4.4 
中 位 数 ( 美 元 ) 45843 
来 源 :SIPP。 
小 结 


表 3.3 家 庭 户 资产 净值 的 不 平等 测量 :SIPP(1991 年 和 2001 年 ) 


2001 


221977 
1458 
8. 840 


664 
—0. 018 
0. 766 
0. 769 
12.9 
4.2 
52146 


本 章 介绍 了 一 套 选 取 的 概要 不 平等 测量 。 附 表 Al 列 出 了 每 一 个 测量 的 名 
称 和 公式 。 通 过 以 假设 的 和 真实 的 例子 进行 示例 说 明 ,我 们 讨论 了 每 一 个 测量 
背后 的 基本 原理 ,并 通过 位 置 . 尺 度 和 形状 改变 将 它们 联系 起 来 。 具 体 研究 中 
不 平等 测量 的 选择 取决 于 一 些 原则 ,它们 使 得 我 们 能 在 各 方面 对 不 平等 测量 进 
行 比较 。 我 们 将 会 在 下 一 章 中 讨论 该 问题 。 


aa 
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第 3 章 中 所 讨论 的 一 些 概要 不 平等 测量 属于 指数 族 , 且 每 一 族 都 涉及 一 个 
可 以 取 许 多 值 的 参数 。 既 然 概要 不 平等 测量 数量 众多 ,那么 ,我 们 如 何 选取 一 
个 或 若干 个 满足 具体 研究 需要 的 测量 呢 ? 了 解 一 个 不 平等 测量 是 否 满足 具体 
研究 所 期 望 的 某 些 原则 是 个 好 的 开始 。 我 们 现在 就 开始 讨论 这 些 原则 ,包括 弱 
转移 原则 、 强 转移 原则 、 尺 度 无 关 性 、 人 口 无 关 原 则 和 可 分 解 性 。 我 们 将 定义 这 
些 原 则 ,解释 为 什么 它们 对 于 选择 不 平等 测量 而 言 是 重要 的 ,并 检查 第 3 章 中 所 
讨论 的 每 一 个 不 平等 测量 是 否 满足 这 些 原则 。 本 章 也 提供 了 适合 这 些 原则 的 
经 验 例子 。 在 介绍 了 5 个 原则 之 后 ,我 们 会 讨论 选取 对 一 个 人 口 进 行 考 察 的 不 
平等 测量 的 理论 和 实际 考量 。 最 后 ,我们 提出 洛 伦 兹 占 优 作为 对 不 同人 口 进行 
比较 的 一 个 首要 指导 准则 。 


弱 转 移 原 则 


由 道 尔 顿 首次 介绍 的 转移 原则 现在 被 称 做 “ 弱 转 移 原 则 ”, 该 原则 关注 两 个 
社会 成 员 之 间 的 一 次 收入 转移 之 后 社会 福利 的 变化 ,如 第 3 章 中 的 讨论 。 我 们 
设想 以 下 情景 :出 现 了 收入 从 一 个 更 穷 的 人 向 一 个 更 富 的 人 的 转移 ,但 这 两 个 
人 相对 于 对 方 的 总 收入 以 及 转移 以 后 的 秩 都 没有 改变 ,也 就 是 说 ,不 到 他 们 收 
入 差 值 的 一 半 被 转移 了 。 在 其 他 情况 相同 的 情况 下 ,收入 从 更 穷 的 人 向 更 富 的 
人 的 任意 一 次 转移 ,都 应 当 总 是 使 得 不 平等 测量 上 升 (Sen，1973) 。 此 原则 被 称 
为 "让 古 一 道 尔 顿 转移 原则 ”。 和 森 (Sen) 写 道 : 
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实际 上 , 早 在 1920 年 时 , 休 。 道 尔 顿 (Hugh Dalton) 已 经 论证 过 , 任 
一 不 平等 测量 必定 具有 这 一 对 低 限度 的 性 质 。 既 然 道 尔 顿 在 这 点 上 追 
随 了 他 在 此 语 境 中 所 引用 的 庆 古 的 指引 ,我 们 必须 称 之 为 “ 店 古 一 道 尔 
顿 条 件 ”。 


这 一 条 件 现在 被 称 为 “ 弱 转 移 原 则 ”, 它 表达 了 在 其 他 条 件 相同 的 情况 下 ， 
收入 从 更 富 的 人 向 更 穷 的 人 的 转移 会 导致 不 平等 的 缩减 。 

第 3 章 中 回顾 的 许多 不 平等 测量 都 服从 弱 转移 原则 。 正 如 第 3 章 中 详细 讨 
论 过 的 , 阿 特 金森 指数 族 和 一 般 性 的 炉 测 量 族 满足 此 原则 。 基 尼 系 数 G 通常 也 
等 价 于 阿 特 金森 指数 (Sen， 1976) , 故 也 满足 此 原则 。 

不 过 ,对 数 方差 v 和 方差 的 对 数 vi 并 不 总 是 服从 弱 转 移 原则 。 我 们 有 可 能 
阐明 一 些 解释 收入 转移 如 何 影响 对 数 方差 的 结果 。 这 些 结果 取决 于 与 收入 分 
布 的 上 尾部 有 关 的 某 种 条 件 , 它 表明 ,总 体 中 的 所 有 收入 水 平 都 不 超过 元 ,其 
中 ,5 表示 总 体 均值 ,而 。 = 2, 71828, 这 一 条 件 说 明 , 最 高 收入 水 平 相对 于 平均 
收入 而 言 ,并 不 算 太极 端 。 对 于 收入 或 其 他 资源 的 右 偏 分 布 ,最 大 值 不 到 均值 
的 3 倍 是 少 有 的 ,这 将 导致 此 条 件 得 不 到 满足 。 在 任何 情况 下 ,如 果 收入 分 布 满 
足 这 一 条 件 ,那么 ,对 于 收入 满足 y; < yy 的 任意 一 对 个 体 i 和 j , 当 我 们 将 收入 
BB < Con + oy) 从 个 体 j 向 个 体 i 转移 时 ,以 ”测量 的 不 平等 会 下 降 。 另 一 
方面 , 当 条 件 不 满足 时 ,对 于 其 收入 满足 Je < yi 二 yy 的 任意 一 对 个 体 i 和 j， 
KAR a < E Oi +y) 从 个 体 j 向 个 体 i 的 转移 会 导致 以 v 测量 的 不 平等 上 
升 。 对 数 的 方差 ui 不 满足 弱 转 移 原则 的 原因 更 为 直观 (Foster B- Ok, 1999)。 
因为 转移 被 界定 ,以 便 不 改变 总 收入 ,所 以 ,大 多 数 不 平 等 测量 (除了 w ) 中 所 使 
用 的 平均 收入 了 也 并 未 发 生变 化 。 但 是 ,对 数 收入 的 均值 在 转移 后 发 生 了 变 
化 。 如 果 对 数 收入 的 均值 的 变化 超过 了 个 体 收入 的 变化 ,那么 ,za 也 许 在 富 人 
到 穷人 的 收入 转移 后 会 上 升 。 如 果 转移 不 处 于 极 上 尾部 ,这 一 条 件 也 不 可 能 碰 
巧 出 现 。 

比如 ,使 用 SIPP 2001 年 的 数据 ,为 了 使 对 数 方差 v 在 从 yj 到 y; 的 转移 之 
后 增加 ,我 们 在 元 二 yi < yj 的 条 件 下 ,人 为 地 制造 一 次 富 人 到 穷人 的 收入 转 
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移 。 我 们 根据 收入 ,对 家 庭 户 进行 排序 ,以 识别 出 1096(4%%) 个 收入 超过 元 = 
136822 美元 的 家 庭 户 。 然 后 ,最 高 排序 的 家 庭 户 将 290000 美元 (这 不 到 他 们 收 
入 差 值 的 一 半 ) 赠 与 顶部 4% 里 最 低 排 序 的 家 庭 户 。 转 移 之 后 ,赠与 者 仍然 比 受 
赠 者 更 富有 。 和 转移 前 , v= 0. 96850, 转移 后 , v= 0.96854, 表明 尽管 出 现 了 富 
人 到 穷人 的 收入 转移 ,但 不 平等 却 在 增加 。 同 样 ,对 数 的 方差 也 增加 。 同 时 , 方 
Fe ERA ERA BR eR A) SCRUB BE 

基于 分 位 数 的 不 平等 测量 也 可 能 不 满足 弱 转 移 原则 。 收 入 处 在 界定 测量 
的 两 个 有 关 分 位 数 之 间 的 两 个 个 体 间 的 收入 转移 不 应 导致 该 测量 的 改变 。 使 
用 上 述 项 部 4% 的 富 人 到 穷人 收入 转移 的 例子 ,我 们 发 现 ,p95 到 p5 分 位 数 距 、 
中 间 90% 家 庭 户 的 基于 分 位 数 的 偏 度 、 底 部 1/5 的 份额 和 顶部 1/5 的 份额 都 仍 
相同 ,尽管 顶部 4% 中 出 现 了 收入 转移 。 虽然 不 满足 弱 转 移 原 则 ,但 基于 分 位 数 
的 测量 却 经 常 被 用 在 政府 统计 和 学 术 研 究 中 。 采 用 基于 分 位 数 的 测量 的 主要 
优势 在 于 ,分 位 数 不 会 受 异 常 值 或 公用 调查 数据 中 经 常用 到 的 顶部 编码 的 影 
响 。 在 p95 到 p5 分 位 数 距 的 情况 下 ,只 要 顶部 编码 位 于 p95 之 上 ,该 分 位 数 距 
就 不 会 受 顶部 编码 的 影响 。 反 之 , 顶部 编码 确实 会 对 包括 顶部 编码 在 内 的 所 有 
数据 点 的 概要 不 平等 测量 造成 影响 。 


强 转 移 原则 


尽管 弱 转 移 原 则 阐明 了 转移 后 的 收入 分 配 比 转移 前 的 收入 分 配 更 不 平等 ， 
但 它 并 没有 告诉 我 们 , 当 转 移 发 生 时 ,不 平等 变化 的 程度 。 要 求 间 隅 相同 “ 距 
离 ” 的 两 个 个 体 间 的 一 个 固定 的 转移 量 带 来 同样 多 的 不 平等 减少 似乎 是 合理 
的 。 换 言 之 ,对 于 固定 距离 上 的 一 次 转移 ,所 引起 的 不 平等 变化 只 取决 于 赠与 
者 和 受 赠 者 的 收入 份额 。 因 此 ,可 以 对 以 每 一 个 指数 包含 的 “收入 份额 之 间距 
离 ” 的 形式 ,对 不 同 指数 进行 比较 。 这 就 引出 了 强 转 移 原 则 。 要 满足 强 转移 原 
则 ,不 平等 测量 需要 满足 弱 转 移 原 则 。 强 转移 原则 说 明 , 收 入 转移 会 减少 不 平 
等 ,而 且 , 不 管 赠与 者 和 受 赠 者 在 收入 分 布 上 位 置 如 何 , 如 果 相 同 的 转移 出 现在 
相同 距离 的 两 个 人 之 间 , 那 么 ,不 平等 减少 的 量 是 相同 的 。 术 语 “ 距 离 ” 必 须 小 
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心地 加 以 解释 ,因为 对 于 一 个 给 定 的 满足 强 转 移 原则 的 不 平等 测量 , 必须 设 定 
测量 距离 的 方法 。 

我 们 考虑 的 所 有 距离 ,都 通过 使 用 绝对 差 值 或 某 一 转换 之 后 的 绝对 差 值 ， 
抑或 通过 排序 来 得 到 。 当 更 富 者 的 收入 为 s2 而 更 穷 者 的 收入 为 s 时 ,所 考虑 
的 最 基本 的 距离 是 简单 绝对 差 值 测量 sz 一 51。 使 用 这 一 距离 测量 ,方差 V 满足 
强 转移 原则 。 但 是 ,变异 系数 c 在 采用 这 一 测量 时 ,并 不 满足 此 原则 ,因为 ,正如 
可 证 明 的 那样 ,收入 相差 一 个 固定 量 的 个 体 间 的 收入 转移 所 导致 的 c 的 变化 取 
决 于 V 的 值 。 

与 满足 强 转 移 原 则 的 不 平等 测量 相关 的 其 他 距离 测量 ,可 用 上 面 应 用 收入 
转换 之 后 的 距离 来 定义 。 一 个 例子 就 是 两 个 对 数 转换 的 收入 份额 之 间 的 绝对 
差 值 。 泰 尔 指数 使 用 收入 的 对 数 转 换 , 因 此 ,两 个 人 收入 之 间 的 距离 为 对 数 距 
离 , 即 log(s2) 一 log(s1)。 CHIR ERE S SO AI FEB GE: 等 价 于 了 ,因此 ,对 数 距 
离 应 用 于 GE1。 对 于 包含 设 定 0 值 的 广义 炉 , 我 们 使 用 了 一 个 涉及 收入 份额 的 
指数 函数 的 不 同 转换 : 








这 一 指数 距离 在 0 二 2 时 ,简化 为 绝对 距离 s2 一 31, 而 在 0 二 1 时 , 则 简化 为 对 数 
距离 。 对 于 阿 特 金森 指数 族 , 个 体 7 到 i 较 小 数量 6 的 收入 转移 会 导致 不 平等 
测量 上 接近 SC Cy2) —U" yi)) 的 变化 ,因此 ,这 些 测量 可 被 认为 满足 强 转 移 
原则 的 极 小 形式 , 它 建立 在 以 社会 效用 函数 形式 定义 的 距离 U’ (yz) 一 U C) 
的 基础 之 上 。 没 有 与 基尼 系数 相 联系 的 天 然 的 距离 测量 ,但 与 强 原则 类 似 的 一 
个 属性 对 基尼 系数 而 言 是 具备 的 。 

对 于 都 位 于 下 端 尾 部 、 都 接近 中 位 数 处 或 都 位 于 上 端 尾部 的 两 个 个 体 之 间 
的 收入 转移 而 言 ,这 一 原则 的 强度 确保 了 相同 的 不 平等 减少 ,只 要 它们 之 间 间 
隔 的 距离 (专门 对 应 那个 指数 的 ) 相 同 。 如 果 研 究 关注 的 是 不 平等 变化 的 秩 和 
量 , 就 需要 这 个 属性 (“基数 ”属性 ) ,但 是 ,如 果 研 究 者 的 主要 关注 点 是 比较 各 分 
布 时 的 序 次 , 它 可 能 就 太 严格 。 
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尺度 无 关 性 


尺度 无 关 性 问题 在 第 3 章 中 对 不 平等 测量 进行 介绍 时 就 被 提 及 。 如 果 一 个 
不 平等 测量 在 尺度 改变 一 一 总 体 中 每 个 人 收入 上 一 个 固定 百分比 的 上 升 ( 或 下 
降 ) 一 一 后 仍 未 变化 , 它 就 被 认为 是 尺度 无 关 的 。 所 有 用 平均 收入 、 总 收入 或 任 
意 收 入 (比如 ,几何 平均 收入 和 中 位 数 收入 ) 进 行 了 标准 化 的 不 平等 测量 ,都 具 
有 这 一 属性 (请 见 附 表 A2). c, vO, G, T, As 和 GEo 都 以 平均 收入 5 进行 标 
准 化 ;vi 以 平均 对 数 收入 log(y) 进 行 标 准 化 ,基于 分 位 数 的 偏 度 测量 以 中 位 数 
收入 进行 标准 化 ;收入 份额 则 以 总 收入 进行 标准 化 。 相 反 , 极 差 RR 方差 V 和 分 
位 数 距 都 不 是 尺度 无 关 的 。 





人 口 无 关 原 则 


考察 某 一 人 口 的 收入 不 平等 时 间 趋 势 , 会 因为 此 人 口 从 一 个 时 期 到 下 一 个 
时 期 可 能 正经 历 增长 这 一 事实 而 变 复杂 。 我 们 寻求 独立 于 此 增长 的 不 平等 测 
量 方法 。 对 于 某 一 研究 而 言 , 人 口 的 规模 不 应 当 影响 对 一 个 社会 不 平等 趋势 的 
量化 或 不 同 社会 之 间 的 不 平等 模式 。 人 口 无 关 原则 说 的 是 , 当 我 们 测量 某 个 人 
口 的 不 平等 时 ,这 一 测量 只 取决 于 此 人 口 的 收入 分 布 。 可 争辩 的 是 ,比如 ,可 以 
通过 计算 人 口中 被 认为 处 于 贫困 中 的 个 体 数目 来 测量 社会 福利 。 但 是 ,从 历史 
上 来 看 ,这 类 分 析 一 直 不 是 不 平等 研究 的 焦点 。 人 口 规模 无 关 原 则 与 政府 统计 
和 学 术 研 究 中 所 见 到 的 人 均 收入 概念 有 关 。 

我 们 可 以 做 一 个 简单 的 练习 来 举例 说 明 人 口 规模 无 关 原 则 。SIPP 数据 
2001 年 的 总 样本 是 n = 27294, 我 们 通过 对 样本 中 的 每 一 个 家 庭 户 创建 一 个 一 
模 一 样 的 家 庭 户 ,来 将 SIPP 数据 的 规模 扩大 一 倍 ,所 以 样本 规模 现在 是 2n = 
54588。 显然 ,人 均 收入 仍然 未 变 。 我 们 接着 重新 计算 第 3 章 中 所 回顾 的 不 平等 





Q 原文 此 处 的 符号 为 V, 但 根据 第 3 章 的 内 容 ,实际 上 应 该 是 对 数 方差 v。 一 一 译 者 注 
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测量 ,发 现 它们 在 规模 n 和 规模 2n 两 种 情形 下 完全 相同 。 这 说 明 , 所 介绍 的 选 
取 的 不 平等 测量 满足 人 口 规模 无 关 原理 。 


可 分 解 性 


一 个 社会 通常 按照 种 族 , 性 别 、 教 育 水 平 .年 龄 和 其 他 因素 被 分 为 各 个 群 
体 。 虽然 相同 层 内 的 个 体 之 间 有 存在 差异 的 可 能 性 ,但 我 们 会 观察 到 通过 它们 
所 落 入 的 不 同 层 来 解释 的 社会 个 体 成 员 之 间 的 一 些 差 异 。 同 样 ,我 们 会 考虑 分 
解 某 一 既定 不 平等 测量 的 可 能 性 ,因此 ,总 收入 不 平等 被 区 分 成 组 间 不 平等 ( 比 
如 ,黑人 和 白人 之 间 的 不 平等 ) 和 组 内 不 平等 (比如 ,白人 之 间 的 不 平等 和 黑人 
之 间 的 不 平等 )。 男 一 种 类 型 的 分 解 也 非常 自然 地 出 现在 实际 应 用 中 。 比 如 ， 
收入 可 以 来 自 不 同 的 来 源 ,如 劳动 所 得 和 非 劳 动 所 得 ,这 就 值得 我 们 去 了 解 总 
收入 不 平等 如 何 被 区 分 成 来 源 间 和 来 源 内 两 个 部 分 。 

如 果 一 个 不 平等 测量 可 被 表达 成 组 间 不 平等 加 上 每 一 组 内 不 平等 的 加 权 
总 和 ,那么 , 它 会 被 认为 是 加 和 可 分 解 的 。 这 里 ,我 们 考虑 到 了 权重 取决 于 组 内 
平均 值 和 总 平均 值 的 可 能 性 。 我 们 继续 介绍 前 面 提 到 哪些 不 平等 测量 是 加 和 
可 分 解 的 ,并 给 出 每 一 种 情形 的 详细 分 解 。 这 需要 稍 加 留神 , 因为 我 们 需要 对 
组 间 不 平等 的 权重 和 测量 进行 区 分 。 

方差 提供 了 一 个 熟悉 且 具 有 说 明 性 的 加 和 可 分 解 概念 。 我 们 知道 ,总 方差 
是 组 间 方 差 与 组 内 方差 加 权 总 和 后 的 两 者 之 和 。 我 们 将 这 一 法 则 应 用 于 规模 
为 m 的 白人 群体 和 规模 为 n 的 黑人 群体 的 经 验 数据 。 样 本 总 收入 的 均值 为 3、 
无 偏方 差 为 Vi。 白人 收入 的 均值 为 Swine \ 无 偏方 差 为 Vwht ,黑人 收入 的 均值 为 
yblk、 无 偏方 差 为 Vblk 。 

通过 将 m 个 白人 的 收入 都 变 为 ywht， 7 个 黑人 的 收入 都 变 为 ybtk, 然 后 求 
出 所 得 数据 的 方差 ,就 可 以 得 到 组 间 方 差 V8。 组 内 部 分 VW 就 是 各 组 内 方差 的 
加 权 总 和 。 因 为 无 偏方 差 针 对 样本 规模 进行 了 调整 (全 部 样本 时 为 mnl, 
白人 样本 时 为 m 一 1、 黑 人 样本 时 为 n 一 1), 所 以 ,我 们 需要 在 计算 每 一 个 群体 
的 方差 时 所 用 的 权 数 中 考虑 这 点 。 具 体 而 言 ,白人 的 权重 变 成 了 调整 的 白人 比 
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fi] (m—1)/(m+n—1), 黑人 的 权重 变 成 了 调整 的 黑人 比例 Cn — 1) / Cn +n — 
1) 。 请 注意 ,这 两 个 权重 加 起 来 并 不 等 于 1。 采 用 这 一 设 定 ,我 们 可 以 将 基于 经 
验 数据 的 方差 的 加 和 分 解 表达 成 ， 


VT 一 VB 十 VVW 


= [4.1] 
— VB mi— l 
V tai Wet Volk 





由 于 变异 系数 c 为 以 均值 标准 化 的 标准 差 , 因 此 , 它 的 平方 项 cz 也 是 加 和 
可 分 解 的 。c? 为 以 总 平均 值 的 平方 标准 化 的 总 收入 的 方差 。 组 间 变 异 系数 的 
平方 e286 能 以 与 取得 组 间 方 差 相 似 的 方式 得 到 ,即将 白人 平均 收入 给 予 每 名 和 白 
人 成 员 , 并 将 黑人 平均 收入 给 予 每 名 黑人 成 员 。 这 一 组 间 项 的 标准 化 也 是 以 总 
平均 值 的 平方 来 进行 的 。 不 过 ,既然 各 组 的 变异 系数 的 平方 hm 和 chi 是 以 各 
自 组 平均 值 的 平方 而 不 是 总 平均 值 来 进行 标准 化 的 ,那么 就 必须 使 用 复合 权 
重 , 它 将 调整 的 组 群 比例 与 组 平均 值 和 总 平均 值 之 比 的 平方 组 合 起 来 。 具 体 而 
言 ,白人 的 复合 权重 为 [Cm 一 1)/(m 十 n 一 1)] (ywht/3)?, 黑人 的 复合 权重 为 
[x 一 DD/(m 十 n 一 1)] (ybk/3)?。 因 此 ,ce? 的 加 和 分 解 可 表达 成 : 


c2T = c2B 十 c2W 


= ma \2 = sa \ 2 [4. 2] 
= rl cb 








泰 尔 不 平等 指数 工 是 加 和 可 分 解 的 。 总 泰 尔 指数 TT 为 组 间 部 分 加 上 组 内 
部 分 。 组 间 泰 尔 TB 以 与 组 间 方 差 和 组 间 变 蜡 系数 的 平方 相似 的 方式 得 到 , 即 
赋予 白人 成 员 平 均 的 白人 收入 ,赋予 黑人 成 员 平 均 的 黑人 收入 。 不 过 ,组 内 部 
分 TW 的 权重 则 与 V 或 c? 中 的 情况 不 同 。 权 重 为 组 群 收入 在 总 收入 中 的 份额 : 
白人 的 权重 为 [mywht/ Cm 十 2)3] = [m/《m 十 n)](3wht/3), 而 黑人 的 权重 为 
[n/m 十 n)j(Fblk/3)。 那么 , 泰 尔 的 加 和 分 解 就 是 : 

TT = T8+ TW 


[4.3] 
— TB m Ywht n  yblk 
a oe i vy lb 
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变异 系数 的 平方 和 泰 尔 不 平等 指数 都 是 广义 箭 的 特例 。 在 附录 中 ( 见 作者 为 本 
书 而 建立 的 网 站 ) ,我 们 阐明 了 广义 焙 可 被 以 加 和 方式 分 解 成 组 间 部 分 和 组 内 部 分 。 
使 用 包含 黑人 一 白人 分 组 收入 数据 的 相同 例子 ,我 们 有 以 下 一 般 表 达 式 宁 : 
GE] = GE; +GE;” 
[4.4] 








= GE; Ea 





( a ) GE 六 T 二 n T ri ) G Ej 


m Te 

请 注意 ,在 方程 4. 4 中 ,两 个 权重 相 加 通常 并 不 等 于 1。 方 程 4. 4 将 方程 
4. 2 和 方程 4. 3 一 般 化 ,适用 于 广义 焙 族 中 的 每 一 个 测量 。 

使 用 方程 4. 1 到 方程 4.4 以 及 SIPP 的 2001 年 白人 和 黑人 的 收入 数据 ,我 
们 对 V、c? 和 工 进行 分 解 ( 见 表 4. 1) 。 总 样本 规模 为 23585, 其 中 ,黑人 的 比例 
为 0. 1443。 全 部 样本 的 平均 收入 为 50911 美元 , 其中, 白人 的 平均 收入 为 
53655 美元 ,黑人 的 平均 收入 为 35198 美元 。 对 于 这 些 测 量 ,总 不 平等 为 组 间 不 
平等 与 组 内 部 分 (组 间 不 平等 的 加 权 总 和 ) 之 和 。 得 到 全 部 样本 、 白 人 样本 和 黑 
人 样本 的 3 个 不 平等 测量 很 简单 。 为 了 建立 组 间 不 平等 测量 ,我 们 通过 将 平均 
白人 收入 赋值 给 每 个 白人 ,平均 黑人 收入 赋值 给 每 个 黑人 来 创建 一 个 新 的 收入 
变量 。 每 个 种 族群 体 的 权重 在 3 个 不 平等 测量 上 并 不 相同 。 以 白人 的 权重 为 
例 。 对 于 V, 白 人 的 权重 为 调整 的 白人 组 群 比例 On — DD)/(m 十 n 一 1) = 
[23585(1 一 0. 1443) —1]/(23585—1) = 0. 8557, 因为 样本 规模 很 大 ,因此 ,这 一 
调整 的 组 群 比例 非常 接近 于 未 调整 的 组 群 比例 。 白 人 和 黑人 的 权重 加 起 来 似 
平等 于 1, 但 这 是 由 于 很 大 的 样本 规模 所 导致 的 。 调 整 对 小 规模 样本 而 言 才 是 
重要 的 。c? 在 白人 的 权重 为 V 的 情况 下 的 权重 乘 以 (ywht/3)?，, 为 0.9474。 请 
注意 ,两 个 种 族群 体 的 权重 相 加 并 不 等 于 1。 对 于 了 工 ,白人 的 权重 为 [m/n 十 
1)](ywht/3) = 0. 9004。 白人 和 黑人 的 权重 之 和 在 这 一 情形 中 等 于 1。 这 个 例 
子 解 释 了 与 不 同 不 平等 测量 相 联 系 的 各 种 权重 。 表 4. 2 中 的 加 和 分 解 结果 表 
明 , 总 不 平等 的 主要 来 源 是 组 内 部 分 (97% 一 98%), 白 人 一 黑人 之 间 的 不 平等 
只 解释 了 总 不 平等 中 的 一 小 部 分 (2% 一 3%)。 





O 原文 此 处 第 二 行 等 号 后 第 一 项 为 CEJ ,有 误 , 这 里 已 改 为 CE 。 一 一 译 者 注 
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表 4.1 和 白人 一 黑人 分 组 收入 的 3 个 不 平等 测量 的 加 和 分 解 举例 :SIPP(2001 年 ) 


不 平等 vy 白人 的 ”黑人 的 ”组 内 加 总 的 二 (组 间 十 
wa SH 组 间 GA 黑人 权重 BE 权 总 和 加权 的 组 内 ) 





2077 42 2035 


i= 
(100%) (2%) 2212 989 0.8557 0. 1443 (98%) 0 
0.7989 0.0162 i 0. 7827 
2 > ; k i . 9474 0.0688 : 
€ (100%) (2%) 0.7682 0.7983 0 4 (98%) 0. 0000 
T O: 3013 0. 0093 0. 2955 0.3239 0.9004 0.0996 plea 0. 0000 


(100%) (3%) (97%) 


注 : 样 本 只 包括 黑人 和 白人 ,一 共 23585 个 家 庭 户 。 黑 人 所 占 的 比例 为 0. 1443。 全 部 样本 的 平均 收入 
为 50911 美元 ,白人 的 平均 收入 为 53655 美元 ,而 黑人 的 平均 收入 为 35198 美元 。 方 差 以 百 万 美元 
的 平方 为 单位 。 有 关 得 到 每 一 个 群体 权重 的 方法 ,请 见 正文 。 


有 两 个 现成 的 .用 于 分 解 不 平等 测量 的 Stata 程序 :“ineqdeco” 要 求 结果 变 
量 取 正 数值 “ineqdec0? 人 允许 变量 取 任 意 值 (Jenkins，1999)。 出 于 举例 说 明 的 
目的 , 非 正 数 取 值 已 被 从 SIPP 的 2001 年 收入 数据 中 删除 了 。 我 们 使 用 Stata 
中 的 “ineqdeco” 来 得 到 1991 年 和 2001 4E SC Wei He Al Bal Hep ae BR WE BY FE AR 
解 。 结 果 显 示 在 表 42 P. AET SCRE I AT > AS E SE > BRT IE AB o 
不 过 ,我 们 可 以 将 阿 特 金森 指数 分 解 为 组 间 部 分 、 组 内 部 分 以 及 体现 为 组 间 和 
组 内 部 分 乘积 的 负数 的 残 差 之 和 。 我 们 在 表 4. 2 中 为 阿 特 金森 指数 的 每 一 数值 
增加 了 一 列 残 差 。 该 表 并 未 给 出 基尼 系数 G、 对 数 方差 v 以 及 对 数 的 方差 v1 的 
分 解 ,因为 它们 都 不 是 加 和 可 分 解 的 ,而 且 , 残 差 部 分 也 不 能 像 在 阿 特 金 森 指数 
情况 下 那样 ,以 组 间 和 组 内 项 来 得 到 。 

表 4.2 白人 一 黑人 分 组 收入 的 3 个 不 平等 测量 的 分 解 :SIPP(1991 年 和 2001 年 ) 








1991 2001 
项 目 
总 的 组 间 组 内 残 差 总 的 组 间 组 内 残 差 
GE-, 1. 442 0. 012 1, 430 0 3. 022 0. 011 3.011 0 
GE, 0. 284 0. 010 0. 273 0 0. 345 0. 010 0. 335 0 
GE, 0. 240 0. 009 0. 231 0 0. 307 0. 009 0. 298 0 
GE: 0. 267 0. 008 0. 259 0 0. 399 0. 008 0. 391 0 
Ay 0. 121 0. 006 0.116 —0.001 0.148 0. 005 0.144 —0.001 
A\ 0. 247 0. 014 0.237 —0.004 0.292 0. 012 0.283 =0. 003 
Az 0. 742 0. 037 0.733 —0.028 0.858 0. 116 0.839 —0. 097 


资料 来 源 :SIPP。 
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根据 人 口 分 组 分 解 不 平等 的 方法 可 以 直接 应 用 于 人 口子 区 域 。 比 如 ,如 果 
我 们 想 对 南部 和 非 南 部 以 广义 炉 或 阿 特 金森 族 指数 加 以 测量 的 收入 不 平等 进 
行 比较 ,我 们 就 可 使 用 与 上 面 所 讨论 的 完全 相同 的 方法 。 
许多 有 关 不 平等 分 解 的 经 验 研究 工作 都 关注 人 口 分 组 .收入 或 财富 由 不 
同 的 要 素 构 成 。 比 如 ,收入 来 源 包括 工资 .投资 收入 .福利 支出 .私人 汇款 和 资 
本 收益 /损失 。 财 富 要 素 包括 房产 .股票 和 公募 基金 .储蓄 和 支票 账户 以 及 退休 
基金 。 有 用 的 是 理解 要 素 间 变异 和 要 素 内 变异 如 何 对 总 收入 或 总 资产 净值 产 
生 影 响 。 与 以 子 群 体 进行 分 解 的 问题 不 同 ,允许 以 收入 或 财富 构成 要 素 进行 党 
规 分 解 的 不 平等 测量 相对 较 少 。 变 异 系 数 的 平方 e 和 通常 与 其 等 价 的 测量 ( 比 
如 ,方差 ) 都 允许 根据 要 素 进 行 的 分 解 (Cowell，2000)。 为 了 说 明 这 点 ,我 们 用 
一 个 资产 净值 y; 的 例子 , 它 等 于 总 资产 减 去 总 负债 ,是 一 个 总 财富 的 测量 。 出 
于 简洁 性 的 考虑 ,我 们 定义 两 个 要 素 一 一 房产 净值 yai Pona 
yB ,因此 , yi = yai typi. WES c, ca 和 cB 为 总 净值 .房产 净值 和 其 他 资产 净 
值 的 变异 系数 值 。 令 4 为 要 素 A 的 比例 、p 为 要 素 A 和 要 素 B 之 间 的 相关 系 
数 。c 的 分 解 就 是 : 


2 二 A 十 (1 一 和)2c 咯 十 24(1 一 AcacBp [4. 5] 
既然 GE = c2/2, 我 们 就 能 够 以 GE) 的 形式 来 表达 方程 4. 50, 
GE (2) 一 2CEAC2) + (1 —A)?GEBe) + 2A 一 人 )oVCEAC)CEBC) 
[4.5] 
方程 4. 5 和 方程 4. 5 可 被 应 用 于 资源 变量 的 任意 取 值 范围 ,因此 , 它 适 用 于 
包含 很 大 比例 负 值 和 零 值 的 资产 净值 变量 。 我 们 使 用 SIPP 的 1991 年 和 2001 
年 的 财富 数据 ,结果 显示 在 表 4. 3 中 。 由 于 资产 净值 包含 了 负 值 和 零 值 ,变异 系 


数 与 只 基于 反应 变量 的 正 数 取 值 的 测量 并 不 直接 可 比 。 表 4. 3 的 前 三 行 表明 ， 
变异 系数 从 1. 729 增加 到 8. 841, 主要 反映 了 非 房 产 净 值 不 平等 的 增加 : 从 





O 原文 中 .方程 4. 5 右边 第 二 项 为 (1 一 A)?GEazw), 这 是 不 对 的 。 在 此 改正 为 (1 一 
A)2GEBR2) 。 译 者 注 
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2.518 到 14. 383, K 4.3 中 的 要 素 分 解 , 即 每 一 项 在 整体 中 所 占 的 比例 ,能 够 
揭示 一 些 令 人 感 兴趣 的 趋势 一 一 总 的 房产 净值 在 1991 年 时 为 45. 1%, 而 
2001 年 时 下 降 到 了 39. 0% 一 一 和 两 个 要 素 之 间 的 相关 ,这 一 相关 从 0. 352 下 
降 到 0. 073。 基 于 这 些 基本 统计 结果 ,我 们 发 现 ,房产 净值 的 加 权 贡 献 从 
14. 6% 下 降 到 0. 5% ,而 非 房 产 净值 的 加 权 贡 献 则 从 63. 9% 上 升 到 98.4%. 
方程 4. 5 中 的 第 三 项 源 于 要 素 之 间 的 相关 ,从 21. 5% 下 降 到 1%。 当 以 百 分 
比 的 形式 来 表达 时 ,分 解 提 供 了 两 个 分 布 之 间 的 直接 比较 ,并 识别 出 不 平等 
上 升 的 主要 来 源 。L11] 





R43 含 两 个 要 素 资产 净值 的 变异 系数 分 解 :SIPP(1991 年 和 2001 年 ) 





项 目 1991 2001 
变异 系数 ,总 的 c 1. 729 8. 841 
变异 系数 ,房产 要 素 的 ca 1. 466 1. 630 
变异 系数 ,其 他 要 素 的 cs 2. 518 14. 383 
ca 的 比例 :A 0. 451 0. 390 
要 素 相关 系数 :p 0. 352 0. 037 
总 的 :c 2.991(100%) 78. 159(100%) 
第 1 部 分 :cA 0. 437(14. 6%) 0. 405(0. 5%) 
第 2 部 分 : (1 一 1)2c8 1. 911(63. 9%) 76. 491(98. 4%) 
第 3 部 分 : 24(1 —Adcacep 0. 643(21. 5%) 0. 81401. 0%) 


资料 来 源 :SIPP。 


尽管 基尼 系数 并 不 满足 加 和 可 分 解 性 原则 ,但 一 些 研究 者 将 不 可 加 性 视 为 
一 个 优势 而 非 局 限 。 两 个 不 同 的 分 解 框 架 是 加 和 的 和 交互 的 。 在 加 和 分 解 杠 
架 下 ,组 间 成 分 描述 两 个 群体 之 间 的 平均 差异 ,组 内 部 分 则 描述 剩余 的 变异 。 
在 交互 分 解 框架 下 ,组 群 的 特征 可 被 构想 为 组 群 的 中 心 位 置 及 其 分 布 的 形状 。 
不 同 的 中 心 位 置 和 形状 能 够 导致 不 同 程度 的 组 群 重 倒 。 设 想 一 个 由 两 个 种 族 
群体 构成 的 人 口 一 一 白人 和 黑人 。 不 但 白人 一 黑人 的 平均 收入 差异 较 大 , 而且 
分 布 的 形状 也 不 同 。 在 黑人 和 白人 收入 分 布 重 倒 的 区 域 中 ,一 些 黑 人 具有 比 白 
人 更 高 的 收入 。 平 均 收 入 差异 和 组 群 重合 都 可 被 看 成 组 间 差 异 。 如 果 对 平均 
收入 如 何不 同 及 两 个 群体 如 何 重 倒 感 兴趣 ,那么 ,基尼 系数 分 解 就 可 被 用 来 获 
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取 有 关 信 息 。 

已 有 3 种 方法 被 提出 用 于 分 解 基 尼 系 数 :(1) 图 解法 (Lambert & Aroson， 
1993);(2) 协 方差 法 (Lerman 以 Yitzhaki, 1984; Sastry & Kelkar, 1994);(3) 
成 对 个 体 收 入 比较 法 (Dagum, 1997; Mussard, Terraza & Seyte, 2003), WE 
何 种 方法 ,基尼 系数 分 解 都 强调 组 的 重 倒 及 隐 含 在 其 后 的 实质 含义 ,同时 提供 
对 其 他 不 平等 测量 进行 加 法 分 解 中 所 没有 的 额外 信息 。 

使 用 相同 的 来 自 SIPP 的 2001 年 的 收入 数据 的 白人 和 黑人 样本 ,我 们 计算 
出 总 基尼 系数 为 0. 4221, 它 可 被 分 解 成 3 个 部 分 :组 间 部 分 (黑人 一 白人 平均 收 
入 差异 或 两 个 群体 之 间 的 总 变异 ) 解 释 了 总 基尼 系数 的 10. 6% ,组 内 部 分 (每 一 
群体 内 不 平等 的 加 权 总 和 ) 解 释 了 77. 2%, 重 益 部 分 ( 即 这 样 一 个 事实 :一 些 黑 
人 比 一 些 白 人 具有 更 高 的 收入 ,或 者 两 个 群体 的 转移 变异 ) 解 释 了 12. 2%。 这 
些 结果 与 那些 使 用 加 和 分 解 得 到 的 结果 很 不 同 ,比如 , 泰 尔 系数 和 变异 系数 的 
平方 ,其 中 ,组 内 不 平等 在 总 不 平等 中 占 了 压倒 性 的 份额 (97% 一 98%)。 组 间 
不 平等 只 解释 了 总 不 平等 的 一 个 较 小 的 百分比 (2% 一 3%)。 

当 发 生 一 些 特殊 情形 时 ,诸如 社会 阶级 这 样 的 群体 会 依照 收入 分 配 而 聚 
集 , 导 致 只 包含 组 间 和 组 内 成 分 的 基尼 系数 分 解 (Liao，2006)。 社 会 阶级 被 定 
义 为 这 样 一 群 个 体 :群体 内 在 收入 .教育 和 职业 上 是 同 质 的 ,而 群体 间 在 收入 、 
教育 和 职业 上 是 异 质 的 。 作 者 用 基于 模型 的 聚 类 方法 (Fraley &. Raftery, 
1998) ,依据 观测 的 收入 ,教育 成 就 和 职业 声望 创建 了 排序 好 的 收入 群 。 因 为 这 
些 群 (阶级 ) 被 按照 收入 分 配 从 低 到 高 加 以 排序 ,所 以 跨 阶级 的 成 对 个 体 收 入 比 
较 中 并 不 存在 转移 变异 。 因 此 ,基尼 系数 只 被 分 解 成 两 个 部 分 一 一 阶级 间 部 分 
和 阶级 内 部 分 一 一 而 并 不 存在 交互 部 分 。 所 以 ,收入 分 配 具 有 明显 社会 阶级 分 
界 的 一 个 社会 将 会 有 较 大 的 阶级 间 部 分 。 扩 展 基 尼 系 数 为 处 理 沿 着 收入 分 配 
所 产生 的 集群 提供 了 一 个 有 关 如 何 使 用 阶级 间 部 分 的 相对 贡献 或 其 修正 形式 ， 
以 社会 阶级 来 对 某 一 社会 的 收入 进行 分 层 的 清晰 解释 。 为 了 进一步 量化 不 平 
等 的 结构 , 雇 福 挺进 一 步 发 展 出 结构 不 平等 测量 ,包括 结构 基尼 系数 的 单独 和 
合计 形式 以 及 一 套 结 构 泰 尔 测量 (Liao，2009) 。 
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选择 适合 于 一 个 人 口 的 不 平等 测量 


以 上 讨论 的 5 个 原则 (请 见 附 表 A2) 提 供 了 一 套 基本 标准 ,我 们 可 以 用 它们 
测量 某 一 特定 研究 选取 的 一 个 或 若干 个 所 希望 的 属性 。 选 择 有 时 依据 实质 理 
论 层 面 的 理由 来 作出 ,有 时 则 依据 实际 应 用 层面 的 理由 来 作出 。 

在 实质 理论 层面 上 ,一些 研 究 也 许 本 身 就 关注 所 用 不 平等 测量 的 敏感 性 。 
强 转移 原则 确保 固定 距离 相同 的 两 名 个 体 之 间 固 定量 的 收入 转移 之 后 ,出 现 相 
同 的 不 平等 减少 量 , 这 里 所 谓 的 “距离 ”针对 不 同 的 不 平等 测量 专门 进行 界定 。 
因此 , 强 转移 原则 强调 了 以 距离 形式 体现 的 转移 规模 和 不 平等 测量 的 变化 大 
小 。“ 基 数 ” 属 性 的 概念 被 用 来 描述 此 类 与 大 小 相关 的 变化 。 相 对 而 言 , “序数 ” 
属性 的 概念 被 用 来 描述 与 序 次 相关 的 变化 ,这 是 弱 转 移 原则 所 强调 的 内 容 。 当 
序数 属性 成 为 基本 的 关注 点 时 ,我 们 在 基于 它们 对 收入 分 布 不 同 部 分 的 敏感 性 
TH EV A a ET PE. HA, BRD Se PRS A A SRS GL AE 
是 等 价 的 , 0 二 0 二 1 且 0=1 一 se。 如 果 我 们 主要 关注 测量 的 序数 属性 ,我 们 可 以 
选择 阿 特 金森 指数 或 者 0 在 (0, DKE ERUR SU SESE POSE (EA e BK OO 
的 什么 值 来 满足 所 希望 的 敏感 性 。 极 度 敏 感性 将 需要 用 到 9 在 (0, 1) 区 间 之 外 
取 值 的 广义 焙 。 如 果 我 们 关心 “基数 ”属性 ( 即 大 小 ) ABZ RE PES” SOG 

在 实际 应 用 层面 上 ,基尼 指数 是 应 用 最 广泛 的 不 平等 测量 。 这 一 流行 性 的 
两 个 主要 原因 是 ,其 直接 得 自 洛 伦 兹 曲线 的 直观 意义 以 及 其 (0, 1) 的 取 值 范围 。 
当 研究 者 关心 异常 值 和 收入 和 财富 等 资源 的 顶端 或 底 端 编码 时 ,基尼 指数 是 相 
对 稳健 的 ,因为 它 是 中 部 敏感 的 。 此 外 , 当 可 能 存在 负 值 时 ,正如 收入 和 财富 中 
经 常 出 现 的 情形 ,基尼 指数 可 以 处 理 这 些 数 据 ,而 阿 特 金森 族 和 广义 人 族 中 的 
大 多 数 测量 都 不 行 。 不 过 ,分 解 基尼 系数 后 的 残 差 部 分 难以 解释 。 对 于 关注 分 
解 的 研究 而 言 , 可 以 选择 广义 灶 测 量 而 不 是 基尼 系数 。 

若干 具有 共同 构成 要 素 的 不 平等 测量 可 用 来 深化 对 不 平等 现象 的 理解 。 
在 规模 为 n 的 同一 人 口中 ,个 体 收入 的 份额 可 以 用 个 体 收入 与 平均 收入 的 比值 
来 表达 , 即 s: 二 (1/n) (yi/)。 使 用 收入 比 y;/5 作为 4 个 概要 不 平等 测量 (变异 
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系数 的 平方 .对 数 的 方差 泰 尔 指 数 和 基尼 系数 ) 的 统一 框架 中 的 共同 元 素 JE 
尔 鲍 考察 了 全 球 收入 不 平等 的 模式 (Firebaugh，1999)。 这 个 统一 框架 将 那些 
不 平等 测量 表达 为 收入 比 的 函数 ,衡量 该 收入 比 对 收入 比 为 1. 0 这 一 完全 公平 
情况 的 平均 偏离 (也 请 见 Atkinson, 1970; Cowell, 2000; Shorrocks, 1980), 
此 框架 有 助 于 描述 不 同 的 函数 如 何 导致 那些 不 平等 测量 的 不 同 取 值 。 在 菲 尔 
鲍 的 研究 中 ,4 个 测量 中 的 3 个 提供 了 支持 性 证 据 表明 , 数 百年 来 ,全 球 收入 不 
平等 日 益 增加 的 趋势 从 1960 年 到 1989 年 趋 于 稳定 。 对 数 的 方差 wi 是 一 个 例 
外 , 它 对 收入 分 布 底 端的 变化 更 敏感 ,因为 对 数 转 换 对 右 尾部 要 比 对 左 尾部 压 
缩 得 更 厉害 ,而 左 尾 部 实际 上 呈现 出 世界 收入 不 平等 的 下 降 。 这 个 例子 说 明 ， 
若干 具有 共同 元 素 的 不 平等 测量 可 用 来 对 所 考虑 的 不 平等 模式 进行 更 深入 的 

最 后 , 回 到 两 个 分 布 之 间 的 位 置 、 尺 度 和 形状 改变 上 来 ,各 种 概要 不 平等 测 
量 如 何 捕 提 这 些 改变 ?同时 ,它们 可 被 区 分 开 来 吗 ? 首先 ,根据 定义 ,所 有 尺度 
无 关 的 概要 不 平等 测量 都 被 设计 来 将 其 他 形状 变化 与 尺度 改变 区 分 开 来 。 第 
二 ,比较 两 个 人 口 的 各 概要 测量 描述 了 至 少 两 种 分 布 改变 一 一 位 置 移动 和 形状 
变化 的 组 合 。 为 了 将 位 置 移动 与 形状 变化 (对 于 那些 并 非 尺度 无 关 的 测量 而 
言 ,也 包括 尺度 改变 ) 区 分 开 来 ,我 们 可 以 将 两 个 人 口 视 为 两 个 群体 。 然 后 ,我 
们 可 以 使 用 可 分 解 的 不 平等 测量 来 将 整体 不 平等 测量 分 解 成 组 间 部 分 和 组 内 
部 分 。 组 间 部 分 反映 位 置 移动 ,而 组 内 部 分 则 反映 形状 变化 。 正 如 表 4. 1 所 示 ， 
黑人 收入 和 白人 收入 的 整体 不 平等 可 被 分 解 成 V、c: 和 荆 上 的 位 置 改变 (组 间 
部 分 ) 和 形状 改变 (组 内 部 分 )。V (方差 ) 的 结果 表明 ,位 置 移动 解释 了 全 部 分 布 
差异 的 2%, 而 尺度 和 形状 变化 一 共 解 释 了 98%. c? (变异 系数 的 平方 ) 和 工 ( 泰 
尔 指数 ) 的 结果 显示 ,位 置 移动 解释 了 位 置 和 形状 变异 总 和 的 2. 5% 到 2.9% ,不 
论 是 何 种 尺度 改变 。 





洛 伦 兹 占 优 和 人 口 比 较 


洛 伦 兹 占 优 是 一 个 强 条 件 , 它 确定 无 疑 地 表明 ,收入 分 布 x 比 收入 分 布 y 
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更 加 平等 。 这 一 具有 说 服 力 的 能 力 是 以 一 定 的 代价 换 来 的 :对 于 一 对 收入 分 
布 ,可 能 任何 一 方 都 不 比 对 方 占 优 ,这 被 称 做 “ 洛 伦 兹 交叉 ”。 许 多 有 关 收 入 不 
平等 的 研究 都 致力 于 对 不 同 国家 、 美 国 各 州 、 不 同时 期 以 及 基于 种 族 、 性 别 和 年 
龄 的 社会 群体 之 间 的 收入 分 布 进行 比较 。 此 外 ,也 有 研究 致力 于 比较 政策 对 收 
人 不 平等 的 影响 ,关注 一 项 先进 的 收入 转移 政策 所 带 来 的 不 平等 减少 或 者 一 项 
退化 的 收入 转移 政策 所 带 来 的 不 平等 增加 。 这 一 类 研究 有 一 个 共同 的 关注 : 哪 
种 收入 分 配 更 不 平等 ? 洛 伦 兹 占 优 提供 了 判断 是 否 对 这 个 问题 给 出 了 可 信 答 
案 的 一 个 基本 标准 。 

基于 第 2 章 中 洛 伦 兹 曲线 的 定义 ,每 当 Lz(p) > Ly(p) 对 所 有 的 p E 
Co, 1] (其 中 ,对 于 某 一 个 p, Lz(p) > Ly (p), 也 就 是 x 和 y 不 同 ) 都 满足 时 ,我 
们 可 以 断定 ,收入 分 配 x 洛 伦 兹 占 优 于 收入 分 配 y。 换 言 之 ,x 的 洛 伦 兹 曲线 位 
于 由 平等 线 和 y 的 洛 伦 效 曲线 所 围 成 的 区 域内 。 图 4. 1 展示 了 x 对 y 的 洛 伦 效 
占 优 , 其 中 每 个 都 由 5 个 取 值 组 成 (x = (70, 80, 80, 80, 90}, y = 
{30，60，80，100，130})。 这 个 例子 表明 ,对 于 5 个 p 中 的 每 一 个 ,x 的 累积 收 
入 份额 都 大 于 y 的 累积 份额 ,导致 x 曲线 完全 位 于 y 曲线 上 方 ,出 现 了 一 种 x 洛 
伦 兹 占 优 于 y 的 情形 。 根 据 这 一 模式 ,x 无疑 要 比 y 更 加 平等 。 








一 一 平等 线 。 ”一 -一 Y: 较 多 不 平等 。 --- 尺 : 较 少 不 平 等 


图 4.1 洛 伦 兹 占 优 :假设 数据 
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当 在 某 些 户 处 , Li (p) > Lyp), MEHA p 4b, Li) < Ly Cp) 时 中 ,如 
图 4. 2 中 所 示 , 洛 伦 效 交 叉 就 出 现 了 。 当 x 一 《0.4,，99.9, 99.9, 99.9, 99.9} 对 
应 的 曲线 和 y = (60, 60, 60, 60, 160) 对 应 的 曲线 存在 交叉 时 ,就 需要 另 一 种 
标准 来 判断 哪 种 收入 分 布 更 平等 。 因 此 , 洛 伦 兹 占 优 和 交叉 概括 了 两 个 分 布 之 
间 不 平等 差异 模式 的 两 个 宽泛 类 型 。 


一 一 平等 线 。” 一 -一 对 称 基 准 线 。” ---A: 较 大 的 低 区 域 一 一 B: 较 大 的 上 区 域 





4.2 洛 伦 兹 交叉 :假设 数据 


对 于 小 规模 人 口 而 言 ,可 以 很 容易 地 以 画图 的 方式 来 说 明 洛 伦 兹 占 优 是 否 
存在 于 两 个 分 布 之 间 。 当 人 口 规 模 很 大 时 ,比如 ,一 个 国家 、 州 或 市 的 真实 收入 
分 布 , 我 们 经 常 选取 有 限量 个 p 来 做 图 形 考察 ,因为 查看 所 有 p 上 的 差异 是 不 
可 行 的 。 因 此 ,使 用 概要 不 平等 测量 就 变 得 必要 了 。 这 些 测 量 必须 首先 是 洛 伦 
效 一 致 性 的 。 

洛 伦 效 一 致 性 是 满足 我 们 上 面 所 讨论 5 个 原则 的 其 中 3 个 的 一 种 组 合 : 弱 
转移 原则 、 尺 度 无 关 性 原则 和 和 人口 规模 无 关 原则 。 如 果 x 对 y 的 洛 伦 兹 支配 表 
BA ,x 的 不 平等 测量 不 超过 y 的 该 测量 ,那么 ,这 个 不 平等 测量 就 被 认为 是 洛 伦 





O 原文 此 处 有 错 ,两 种 情形 都 是 Li(p) > Ly(p) ,这 里 已 将 后 一 处 修改 为 L;(p) < 
Ly《p)。 一 一 译 者 注 
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兹 一 致 性 的 。 但 是 ,如 果 一 个 洛 伦 兹 一 致 性 的 不 平等 测量 在 x 中 的 情形 大 于 在 
y 中 的 情形 ,我 们 就 不 能 认为 x 洛 伦 兹 支配 y。 此 表述 要 求 所 有 洛 伦 兹 一 致 性 不 
平等 测量 必须 全 都 一 致 地 表现 为 x 比 y 更 平等 ,这 被 称 做 “ 洛 伦 效 一 致 性 不 平等 
测量 之 间 的 全 体 一 致 性 排序 ”Shorrocks & Slottjie，2002) 。 考 虑 到 洛 伦 兹 一致 
性 不 平等 测量 的 数量 众多 (为 广义 炉 族 的 9 和 阿 特 金 森 族 的 e 等 参数 的 宽泛 取 
值 所 扩展 ), 对 所 有 的 洛 伦 效 一 致 性 不 平等 测量 进行 考察 是 不 现实 的 。 

当 我 们 对 两 个 以 上 的 分 布 进行 比较 时 ,全 体 一 致 性 排序 条 件 甚至 变 得 更 不 
切实 际 。 成 对 比较 的 数量 随 着 分 布 的 数量 呈 几 何 级 数 增长 .2 而 且 我 们 需要 
对 这 些 成 对 比较 的 每 一 对 里 的 所 有 洛 伦 效 一 致 性 不 平等 测量 进行 考察 。 如 果 
我 们 能 够 找到 些许 不 平等 指数 ,它们 就 能 以 较 高 的 准确 性 来 预测 洛 伦 兹 占 优 ， 
那 就 极 具 吸引 力 。 

在 寻找 解决 办 法 时 ,我 们 需要 更 好 地 理解 ,为 什么 使 用 不 同 的 洛 伦 效 一 致 
性 不 平等 测量 可 能 给 出 两 个 分 布 的 洛 伦 兹 占 优 的 不 同 结果 。 问 题 的 关键 在 于 ， 
不 同 的 测量 对 分 布 的 不 同 部 位 上 的 收入 差异 很 敏感 。 比 如 ,基尼 系数 和 泰 尔 指 
数 易 受 分 布 中 部 的 影响 ,而 低 端 1/5 份额 则 易 受 分 布 底部 的 影响 。 相 比 而 言 , 参 
数 0 取 较 大 正 数值 的 广义 焙 易 受 分 布 项 部 末尾 的 影响 , 而 参数 0 取 较 大 负数 值 
KXAN SZ oP AS BAR EB), SEH 3 个 指数 ,每 一 个 容易 受到 中 部 区 
域 .底部 末尾 或 项 部 末尾 的 影响 ,以 较 高 准确 性 预测 全 体 一 致 性 排序 是 可 能 的 。 

基于 使 用 100 个 洛 伦 兹 一 致 性 不 平等 测量 对 80 个 国家 的 收入 分 布 所 进行 
的 研究 (3160 对 比较 ), 索 洛克 斯 和 斯 罗 特 找 出 了 3 个 此 类 不 平等 测量 (Shor- 
rocks & Slottjie，2002) 。 这 些 指数 以 分 布 的 不 同 部 位 作为 对 象 。GEio(0 = 10 
处 的 广义 焙 ) 以 顶部 末尾 作为 对 象 ;CE-z(00= 一 20 SDA SCHED ARERR EB VE 
为 对 象 ,而 中 位 数 以 下 的 份额 Los 则 以 分 布 的 下 半 部 分 为 对 象 。 由 这 3 个 指 
数 所 得 到 的 模式 与 使 用 100 个 不 平等 测量 所 得 到 模式 的 99% 相 一 致 。 少 许 不 
平等 测量 的 其 他 组 合 . 具 有 不 同 参数 e 的 阿 特 金森 族 等 相同 类 型 的 类 别 或 者 基 
尼 系 数 和 其 他 测量 的 组 合 ,都 不 能 以 相似 的 准确 性 水 平 来 预测 全 体 一 致 性 。 

这 里 ,我 们 看 到 广义 焙 的 灵活 性 如 何 有 助 于 对 不 平等 进行 比较 ,以 及 超出 
第 3 章 讨论 的 常规 取 值 范围 [一 1，2] 的 极端 0 值 的 有 用 性 。 此 外 ,我 们 也 看 到 
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不 依赖 于 单个 不 平等 测量 的 重要 性 ,而 许多 研究 者 仍然 仅仅 使 用 基尼 系数 。 寇 
姆 . 阿 特 金森 及 森 的 经 典 著述 都 告诫 我 们 , 别 仅 仅 依赖 单个 不 平等 测量 (Kolm， 
1969; Atkinson, 1970; Sen,，1973)。 仅 使 用 少数 几 个 如 索 洛 克 斯 和 斯 罗 特 所 
建议 的 不 平等 测量 ,就 能 够 高 效 且 准确 地 对 不 同人 口 的 或 时 间 上 的 不 平等 进行 
比较 。 

索 洛克 斯 和 斯 罗 特 的 3 个 不 平等 测量 也 许 并 不 能 恰好 应 用 于 所 有 的 经 验 研 
究 工 作 中 。 但 是 ,分 布 的 中 下 部 区 域 和 两 个 末尾 可 以 作为 一 个 指导 原则 。 我 们 
以 SIPP 收入 趋势 数据 ,用 5 个 洛 伦 效 一 致 性 不 平等 测量 对 8 年 中 的 收入 分 布 
(28 对 比较 ) 进 行 比较 : 索 洛克 斯 和 斯 罗 特 所 用 到 的 3 个 测量 (底部 50% 人 口 的 
收入 份额 Leo. s 、 两 个 针对 分 布 末 尾部 分 的 广义 烂 测 量 GE— 20 Fl GE) jm EZ 
尔 指数 工 和 基尼 系数 C。 表 4.4 给 出 了 针对 所 考察 的 这 8 个 年 份 的 5 个 不 平等 
测量 。 根 据 第 一 列 为 底部 50% 的 人 口 所 拥有 的 收入 份额 ,将 1993 年 排 为 最 平等 
(最 大 收入 份额 ), 而 将 1996 年 排 为 最 不 平等 (最 小 化 收入 份额 ), 这 与 泰 尔 指数 和 
基尼 系数 所 反映 的 情况 (1995 年 最 平等 ,1996 年 最 不 平等 ;类似 ,但 并 不 完全 相同 。 
两 个 针对 末尾 的 测量 对 年 份 的 排序 不 同 , 也 与 关注 中 下 部 区 域 的 测量 不 同 。 当 关 
注 底部 末尾 时 ,1988 年 被 排序 为 最 不 平等 ,1987 年 则 为 最 平等 。 当 关注 顶部 末 

尾 时 ,1996 年 被 排序 为 最 不 平等 ,1995 年 则 为 最 平等 。 我 们 对 5 个 不 平等 测 
量 中 的 每 一 个 都 进行 了 28 对 比较 。 这 些 结果 所 呈现 的 全 体 一 致 性 排序 揭示 出 ， 


表 4.4 针对 中 部 和 两 个 末尾 的 不 平等 测量 :收入 趋势 








年 份 Los T G GE —20) GE 

1985 0. 23104 0. 24678 0. 38580 1. 34E+65 60908 
1987 0. 22846 0. 25165 0. 38986 2. 03E+55 1414 
1988 0. 23360 0. 23588 0. 37962 1, 73E+ 83 467 
1991 0. 23316 0. 23985 0. 38132 1. 42E+-70 5336 
1993 0. 23464 0. 23395 0. 37859 3. 05E+70 1214 
1995 0. 23441 0. 23287 0. 37781 4. 67E+63 428 
1996 0. 21001 0. 31931 0. 42486 6. 46E+73 8857682 
2001 0. 21078 0. 30725 0. 42206 1. 36E+81 281443 


资料 来 源 :SIPP。 
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1991 年 时 的 美国 收入 分 布 比 1993 年 时 更 不 平等 。 我 们 认为 ,1993 年 收入 分 布 
洛 伦 兹 占 优 于 1991 年 收入 分 布 。 但 是 ,对 其 他 年 份 , 则 不 能 得 到 明确 的 结论 。 
尽管 我 们 用 了 5 个 不 平等 测量 ,但 是 这 一 结论 也 可 以 只 用 索 洛 到 斯 和 斯 罗 特 提 
议 的 3 个 测量 而 得 到 。 


小 结 


本 章 将 关注 点 集中 在 一 套 广泛 使 用 的 不 平等 测量 上 ,从 那些 与 概率 分 布 相 
联系 的 测量 到 那些 基于 分 位 数 函 数 和 洛 伦 兹 曲线 的 测量 ,以 及 从 那些 由 社会 福 
利 函 数 推导 得 到 的 测量 到 那些 根据 信息 理论 发 展 出 来 的 测量 。 概 要 不 平等 测 
量 的 5 个 原则 有 助 于 选取 不 平等 测量 来 考察 一 个 人 口 的 收入 分 布 。 洛 伦 兹 占 优 
为 使 用 最 少量 的 一 套 不 平等 测量 来 对 人 口 收入 分 布 进行 比较 提供 了 指导 。 这 
一 人 口 比 较 的 方法 首先 根据 一 个 单一 分 布 得 到 概要 不 平等 测量 ,然后 在 不 同人 
口 之 间 比 较 这 些 不 平等 测量 。 一 个 替代 方法 是 ,首先 基于 两 个 分 布 建立 一 个 相 
对 分 布 , 然 后 考察 这 一 相对 分 布 的 概要 测量 指标 。 这 属于 下 一 章 的 主题 。 
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到 目前 为 止 ,在 两 个 分 布 的 比较 中 ,所 采用 的 方法 一 直 是 对 每 一 分 布 的 概 
要 统计 量 进 行 比较 ,或 者 在 洛 伦 效 占 优 的 情况 下 ,确定 一 个 分 布 的 整个 洛 伦 兹 
曲线 是 否 读 驾 于 另 一 个 之 上 。 通 过 建立 意 在 描述 一 个 分 布 如 何 与 另 一 个 分 布 
相 联系 的 单一 相对 分 布 , 相 对 分 布 方法 可 以 对 收入 分 布 进行 更 全 面 的 比较 。 相 
对 分 布 方法 的 一 个 优势 就 在 于 , 它 可 应 用 于 取 值 范围 没有 限制 的 那些 分 布 。 比 
如 , 当 有 可 能 出 现 负 值 时 ,可 以 考虑 相对 分 布 。 此 外 ,相对 分 布 界定 了 一 个 无 单 
位 的 测量 ,使 我 们 可 以 对 想 要 的 测量 ,如 收入 、 教 育 年 限 、 身 高 和 体重 等 各 种 量 
对 应 的 不 同人 口 的 相对 分 布 进行 比较 ,并 且 可 以 直接 根据 相对 分 布 推导 出 若干 
个 不 平等 测量 。 另 一 个 关键 优势 是 ,相对 分 布 方法 允许 就 分 布 的 特定 部 分 , 特 
别 是 下 尾部 和 上 尾部 分 别 进行 考察 。 汉 考 特 和 莫 里 斯 为 社会 科学 读者 系统 地 
介绍 了 相对 分 布 方法 (Handcock &- Morris, 1999) ,本 章 从 该 来 源 中 汲取 了 基本 
素材 。 对 于 经 验 研 究 者 ,我 们 给 出 了 可 应 用 于 经 验 数据 的 公式 。 本 章 的 目标 
是 ,将 相对 分 布 方法 作为 对 已 有 概要 不 平等 测量 的 重要 补充 来 加 以 介绍 。 


相对 秩 、 相 对 分 布 、 相 对 密度 


每 当 要 对 两 个 人 口 的 某 个 量 的 分 布 进行 比较 时 ,都 可 以 引入 相对 分 布 概 
念 。 为 了 继续 进行 ,有 必要 从 两 个 分 布 中 挑选 出 其 中 之 一 ,将 其 称 做 “ 比 对 分 
布 ” 男 一 个 则 称 做 “参照 分 布 "。 比 如 ,既然 黑人 人 口 属于 少数 人 口 ,我 们 将 黑 
人 人 口 的 收入 与 白人 人 口 的 收入 进行 比较 时 ,通常 将 黑人 收入 分 布 作为 比 对 ， 
而 将 白人 收入 分 布 作为 参照 。 
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相对 分 布 概念 的 关键 取决 于 这 样 一 种 想法 :为 比 对 人 口中 的 每 一 单个 取 值 
y 确定 其 相对 于 参照 分 布 的 秩 。 这 个 相对 秩 被 定义 为 参照 人 口中 取 值 不 超过 y 
的 人 口 比例 。 令 Fo 表示 参照 人 口 的 累积 分 布 函 数 ,那么 ,这 一 比例 就 由 Fo Cy) 
给 出 。 在 这 个 情形 中 ,确定 参照 人 口中 这 一 y 值 的 相对 秩 的 转换 被 称 为 “等 级 
转换 ”, 且 当 比 对 人 口 的 数据 被 以 这 一 等 级 转换 进行 转换 时 ,所 得 数据 被 称 为 
“相对 数据 ”。 在 Stata 中 ,可 以 用 詹 恩 编写 的 程序 “relrank” 来 进行 等 级 转换 并 
创建 相对 数据 (Jann，2008) 。 

为 了 举例 说 明 ,我 们 考虑 黑人 中 位 数 收入 (26763 美元 ) 在 白人 收入 分 布 中 
的 相对 秩 。 我 们 在 白人 收入 分 布 中 找 出 低 于 该 值 的 累积 概率 ,也 就 是 收入 小 于 
26763 美元 的 白人 家 庭 户 所 占 的 比例 ,其 恰好 等 于 0. 2975。 因 此 ,应 用 于 黑人 中 
位 数 收入 的 等 级 转换 为 r= 二 F? ( $ 26763) = 0. 2975, 表明 典型 的 黑人 家 庭 户 (处 
在 黑人 中 位 数 收入 上 ) 在 白人 收入 分 布 中 ,排列 在 低 于 1/3 的 位 置 处 。 

令 了 表示 取 自 比 对 分 布 的 一 个 随机 值 .“ 相 对 分 布 ?被 定义 为 这 个 (随机 ) 
值 的 相对 秩 的 分 布 。 我 们 用 尺 表 示 这 一 随机 相对 秩 , 则 R = FOC y), 即 比 对 分 
布 的 一 个 随机 抽取 的 等 级 转换 。 直 接 根据 定义 ,我 们 知道 ,R 取 0 到 1 之 间 的 
值 。 量 可 被 解释 成 比 对 人 口中 的 一 个 随机 抽取 在 参照 人 口中 的 相对 位 置 ,这 
里 用 相对 位 置 , 我 们 意 指 取 值 不 超过 该 随机 抽取 所 对 应 数值 的 参照 人 口 比例 。 

我 们 用 符号 下 表示 比 对 分 布 (黑人 收入 ) 的 累积 分 布 函数 , Q = F 表示 对 
应 的 分 位 数 函 数 ,并 且 ,我 们 令 Y 表示 一 个 以 为 其 累积 分 布 函 数 的 随机 变量 
(比如, Y 是 一 个 被 抽 中 的 黑人 收入 )。 同 样 ,F?9、Q& 和 Y? 表示 参照 人 口 ( 白 人 ) 
中 的 这 些 量 。 作 为 随机 变量 ,R 有 一 个 累积 分 布 函 数 , 被 称 做 “相对 累积 分 布 函 
数 ”, 记 为 G; 男 外 ,还 有 一 个 概率 密度 函数 (相对 概率 密度 函数 ) , 记 为 g; 也 有 一 
个 分 位 数 函 数 ,被 定义 为 相对 累积 分 布 函 数 的 逆 , 即 QR(r) = G). 依据 定 
义 , 相 对 累积 分 布 函数 给 出 了 小 于 或 等 于 某 一 给 定 值 > 的 概率 ,因此 ,我 们 可 以 
将 这 表达 成 比 对 累积 分 布 函数 和 参照 分 位 数 函 数 的 形式 : 

G(r) = PIR<r)= PLF Y) < r] = PY <Q) = F (r) 


换言之 ,相对 累积 分 布 函数 G 等 价 于 F。*Q0(r) ,后 者 是 由 (FF。Qo)(Cr) = 
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FECR) 所 界定 的 函数 ,并 被 定义 成 两 个 函数 下 和 Q& 的 组 合 。 


相对 分 布 的 分 位 数 函 数 可 以 通过 取 相 对 累积 分 布 函数 的 逆 来 得 到 : 
(FeQ)-1 = (Q) °F = Fog 


所 以 ,分 位 数 函 数 具 有 以 下 形式 : QRO = Fo(Q(r))。 请 注意 ,如 果 我 们 调换 比 
对 和 参照 分 布 的 位 置 ,那么 ,相对 累积 分 布 函 数 G 就 会 变 成 随机 变量 R = 
FOY?) 的 累积 分 布 函 数 , 则 我 们 看 到 : 

G(r) = PER < r]= PLF?) <r]= PLY < Q0) ]= Fo(QCc-)) 


这 是 原初 的 相对 分 位 数 函数 , 即 这 一 颠倒 使 得 累积 分 布 函数 等 于 原初 的 分 位 数 
函数 ,而 分 位 数 函数 则 变 成 了 原初 的 累积 分 布 函数 。 

相对 累积 分 布 函 数 具有 简单 的 解释 :如 同 任 一 累积 分 布 函数 一 样 , 它 让 我 
们 可 以 确定 一 个 分 布 集中 在 何 处 ,此 处 为 相对 于 参照 分 布 的 分 位 数 , 比 对 分 布 
的 分 位 数 集中 在 何 处 。 它 是 一 个 满足 GO = 0 AGC) = 1 的 单调 增 函 数 。 此 
函数 的 图 形 包含 在 单位 正方 形 (C, s): OX r <1, 0<s<1} 中 ,并 从 左下 角 
(0, 0) 扩 展 至 右上 角 (1, 1)。 此 函数 的 图 形 是 一 条 斜率 为 1 的 直线 。 因 此 ,对 于 
变量 r 的 所 有 取 值 ,都 有 GO) = r, 这 对 应 着 两 个 分 布 相同 的 情形 。 

其 他 极端 情形 也 有 简便 的 解释 。 如 果 相 对 累积 分 布 函 数 对 于 小 于 某 一 特 
定 值 的 + 值 取 值 为 0, 然 后 在 r* 处 出 现 一 个 大 小 为 1 的 跳跃 ,而 对 于 大 于 rr* 
的 r 值 取 值 为 1, 那 么 我 们 知道 , 比 对 人 口中 的 所 有 个 体 都 具有 与 参照 人 口 的 第 
r* 分 位 数 相同 的 取 值 。 更 一 般 而 言 ,相对 累积 分 布 函 数 可 以 是 集中 在 单位 区 间 
LO, 1] 上 的 任意 离散 概率 分 布 ,在 此 情形 下 ,其 图 形 看 上 去 似乎 是 平 的 ,除了 在 
LO, IJJ ris r2; cts rg 处 出 现 了 大 小 为 p1，pz，…，ps WR 个 跳跃 之 外 。 
这 种 情形 与 比 对 分 布 集中 在 参照 分 布 的 比例 为 pi. pos os pe 的 第 k 分 位 数 
Q Cri), e, QCre) 上 的 情形 相对 应 。 正 如 在 导论 中 所 指出 的 ,相对 分 布 是 无 
单位 的 。 知 道 相对 分 布 并 未 揭示 出 与 比 对 或 参照 人 口 的 分 位 数 真实 数值 有 关 
的 信息 。 在 允许 我 们 确定 一 个 分 布 中 的 哪个 分 位 数 与 另 一 个 分 布 的 给 定 分 位 
数 相 对 应 这 一 意义 上 ,相对 分 布 仅仅 提供 了 两 个 分 布 之 间 的 一 个 映射 。 

回 到 上 面 的 例子 ,我 们 可 以 取 > 为 0. 2975, 因 此 ,参照 (白人 ) 收 入 分 布 的 第 
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r 分 位 数 为 26763 美元 。 另 一 方面 ,26763 美元 是 比 对 (黑人 ) 收 入 分 布 的 中 位 
数 ,因此 ,我 们 可 以 将 以 上 等 级 转换 观测 解释 成 表达 了 特定 取 值 0. 2975 处 的 相 
对 累积 分 布 函 数 : 


G(0. 2975) = F( $ 26763) = 4 


可 以 对 位 于 0 到 1 之 间 的 每 个 ~ 值 进行 类 似 的 计算 ,得 到 一 个 有 关 这 两 个 收入 
分 布 之 间 关系 的 综合 概括 。 

基于 针对 两 个 人 口 而 收集 得 到 的 数据 ,我 们 用 一 种 简单 的 两 步骤 方式 来 完 
成 刚才 所 说 明 的 计算 ,以 得 到 经 验 相 对 累积 分 布 函 数 。 首 先 , 我 们 确定 参照 分 
布 的 (经 验 ) 分 位 数 函 数 。 令 参照 数据 为 Y,，…，wyw ,将 这 些 值 按 从 小 到 大 的 顺 
序 进行 排列 ,得 到 序 次 统计 量 yb) os yon 。 我 们 通过 取得 A k/a 1) = 
Veo 来 界定 形式 k/(n+ 1) 的 r+ 值 处 的 经 验 分 位 数 函 数 。 对 于 连续 取 值 上 的 x, 如 
k/ (n+) A CR+D/ +1), 我 们 以 线性 内 插 来 定义 ÂC, E 


r—(k/(n+1)) 
1/(n+1) 


Ch Dat 1) —r 2 
ant D Yk) 





Â? (r) = yety) 十 





接 下 来 ,我 们 利用 比 对 样本 My Ya 来 完成 经 验 相 对 累积 分 布 函数 的 计 
算 。 对 于 任 一 给 定 的 7 值 ,我 们 取得 : 





Ae) — Smt SOP HSE 


比 对 样本 yio e yn 中 的 数值 小 于 或 等 于 QoC7) 的 比例 。 

其 他 有 关 两 个 分 布 之 间 关 系 的 定性 表述 可 以 根据 相对 累积 分 布 函数 来 得 
到 。 完 全 落 人 对 角 线 下 方 的 相对 累积 分 布 函 数 的 图 形 , 即 对 于 所 有 的 r A 
Gir) 一 与 对 于 > 的 所 有 取 值 ,有 Ô <Q) 这 一 条 件 相 对 应 ,意味 着 参照 
分 布 的 分 位 数 都 没有 超过 相应 的 比 对 分 布 的 分 位 数 。 比 如 ,参照 人 口中 的 第 25 
百 分 位 数 小 于 或 等 于 比 对 人 口中 的 第 25 百 分 位 数 ,参照 人 口中 的 第 50 百 分 位 
数 小 于 或 等 于 比 对 人 口中 的 第 50 百 分 位 数 ,参照 人 口中 的 第 75 百 分 位 数 小 于 
或 等 于 比 对 人 口中 的 第 75 百 分 位 数 ,如 此 等 等 。 极 深刻 的 意义 在 于 , 比 对 人 口 
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比 参照 人 口 更 富裕 。 相 反 , 完 全 处 在 对 角 线 上 方 的 相对 累积 分 布 函数 的 图 形 ， 
即 对 于 所 有 的 >, 有 GO) Sr , 则 其 与 对 于 > 的 所 有 取 值 ,有 Qo(r) SQW) 这 一 
条 件 相对 应 ,意味 着 比 对 人 口 的 分 位 数 都 没有 超过 相应 的 参照 分 布 的 分 位 数 。 
如 果 相 对 累积 分 布 函数 呈现 含 G(1/2) = 1/2 的 倒 S 形 ,这 就 对 应 着 如 此 情形 : 
那些 处 在 比 对 人 口 更 低 分 位 数 中 的 人 , 比 那些 处 在 参照 人 口 对 应 分 位 数 中 的 人 
更 穷 ,而 那些 处 在 比 对 人 口 更 高 分 位 数 中 的 人 , 比 那 些 处 在 参照 人 口 对 应 分 位 
数 中 的 人 更 富 。 





0.00.20.40.60.81.0 0.00.20.40.60.81.0 0.00.20.40.60.81.0 
a F r 
(a) b) (c) 


图 5.1 相对 累积 分 布 函数 的 3 种 情形 


相对 分 布 具有 单调 转换 无 关 性 的 诱 人 性 质 。 给 定 一 个 单调 增 函 数 y, 如果 
我 们 将 这 个 函数 应 用 于 参照 和 比 对 人 口中 ,相对 累积 分 布 函数 不 会 被 改变 。 比 
如 ,我 们 对 两 个 人 口中 的 所 有 收入 都 进行 对 数 转 换 , 相 对 分 布 就 不 会 受 影响 。 
因此 ,任何 依据 相对 分 布 推导 得 到 的 概要 统计 量 ,都 将 具有 这 一 无 关 性 性 质 
为 了 理解 这 一 性 质 如 何 保持 不 变 ,来 看 看 y(Y) 的 累积 分 布 函 数 ,转换 后 的 比 对 
值 Y 变 成 如 下 形式 : 

PEY) <zrj= PLY <1) I= FW" ()) 
(ERIA Ai eH A 2A KR F o gl, TALE, PCY) AY OP fir Be PH Be EM T 
(Fey!) = pF? = g°Q, 同样 ,转换 后 的 参照 值 y(Y?) 的 累积 分 布 函数 和 
分 位 数 函 数 分 别 由 Fey Al oO 给 出 。 然 后 ,转换 后 的 相对 累积 分 布 函 数 变 
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成 了 下 述 组 合 : 
(Fo (y! Q) = FQ 


这 与 转换 前 的 相对 累积 分 布 函 数 完全 一 样 。 
累积 分 布 的 概要 统计 量 可 用 来 对 比 对 分 布 和 参照 分 布 进行 比较 。 比 如 , 相 
对 分 布 的 均值 ， 


1 è 


E(R) = | re@ar = ELP(y)]= | PUG ETR 


给 出 了 取 值 落 在 从 比 对 分 布 中 随机 抽取 的 数值 之 下 的 参照 人 口 的 期 望 比例 上 。 
比如 ,对 于 各 对 相同 的 分 布 ,这 个 值 是 1/2, 因 此 ,一 个 极其 自然 的 做 法 就 是 将 相 
对 分 布 的 均值 与 1/2 进行 比较 。 当 ECR) 二 1/2 时 ,平均 而 言 ,不 到 一 半 的 参照 
人 口 将 具有 落 在 从 比 对 分 布 中 随机 抽取 的 数值 之 下 的 一 个 取 值 ,因此 ,大 多 数 
人 通常 都 将 具有 一 个 更 大 的 取 值 。 粗 略 地 讲 , 我 们 可 以 认为 , 比 对 人 口 具 有 比 
参照 人 口 更 低 的 取 值 。 当 ECR) 1/2 时 ,我 们 可 以 得 到 相反 的 结论 。 

同样 ,相对 分 布 的 中 位 数 


G(1/2) = F(Q°(1/2)) = PLY <Q (1/2) J 


由 取 值 落 在 参照 人 口中 位 数 之 下 的 比 对 人 口 的 比例 给 出 。 因 此 ,条 件 G(1/2) < 1/2 
显示 了 参照 人 口 将 具有 比比 对 人 口 更 小 取 值 的 倾向 。 如 果 G(1/2) > 1/2, 我 们 
会 得 到 相反 的 结论 。 


相对 比例 和 相对 密度 


相对 比例 也 容易 解释 ,尽管 它 描述 了 比 对 分 布 中 各 分 位 数 上 的 个 体 ,以 参 
照 分 布 的 分 位 数 来 看 集中 在 何 处 。 对 于 任意 概率 密度 函数 ,曲线 下 方 的 面积 都 
是 1, 某 点 上 的 函数 也 就 是 该 处 相对 分 布 的 导数 。 两 个 值 rl 和 xz 之 间 曲 线 下 的 
面积 为 取 值 位 于 参照 人 口 的 第 ni 和 第 rz 分 位 数 之 间 的 比 对 人 口 的 比例 。 

就 相对 累积 分 布 函数 的 表达 式 G(r) = FC (7)) 对 > 求 微分 ,得 到 一 个 相 
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对 密度 函数 的 表达 式 : 


CQ0Cr)) 
ED = AR) [5.1] 


假如 数据 是 从 两 个 总 体 中 抽样 得 到 的 :YY ,…, Yh 来 自 参照 总 体 , 而 Yi. ，…， 
Yn 来 自 对 比 总 体 ,那么 ,相对 密度 估计 的 最 直接 方法 建立 在 相对 比例 的 基础 之 
上 。 我 们 选取 在 其 上 计算 分 位 数 的 一 些 值 。 在 接 下 来 的 讨论 中 ,我 们 用 十 分 位 
数 。 我 们 用 参照 数据 来 计算 参照 样本 的 十 分 位 数 Qo(i/10)。 然后 计算 位 于 每 
个 1/10 Ji = [Q°G/10), Q°G+1/10)) 中 的 比 对 样本 的 比例 p;。 在 区 间 J; 上 
取 值 的 分 段 常数 函数 为 p; ,可 被 看 做 相对 密度 的 一 个 简单 佑 计量 。 假 定 比 对 分 
布 和 参照 分 布 相同 ,那么 ,我 们 预计 此 函数 看 上 去 会 很 像 L0, 1] 上 的 均匀 密度 ， 
也 就 是 说 ,我 们 期 望 该 值 在 整个 区 间 上 的 取 值 接近 于 1。 对 这 一 基准 情形 的 偏 
离 也 易于 解释 。 

估计 相对 密度 的 更 复杂 的 方法 也 很 容易 得 到 。 实 际 上 ,根据 数据 来 估计 相 
对 密度 g(x) ,要 比 估计 相对 累积 分 布 函 数 G 精巧 得 多 ,因为 ,正如 方程 5. 1 所 反 
映 的 ,确定 某 个 取 值 + 上 的 概率 密度 函数 涉及 在 参照 分 布 分 位 数 Qo(r) 上 ,以 数 
据 来 估计 参照 分 布 和 比 对 分 布 两 者 的 概率 密度 函数 。 因 此 ,为 了 理解 所 涉及 的 
问题 ,只 需要 考虑 基于 一 个 样本 来 估计 一 个 分 布 的 概率 密度 函数 的 问题 。 下 面 
是 对 核 密度 估计 的 一 个 简单 讨论 , 旨 在 让 那些 不 熟悉 密度 估计 的 读者 认识 一 些 
主要 问题 。 

我 们 现在 考虑 一 个 从 概率 密度 函数 为 f 的 分 布 F 得 到 的 样本 XI1，…，Xn。 
既然 f(z) 是 下 在 + 上 的 导数 ,我 们 可 以 将 其 写 为 : 


入 (下 十 有) 一 下 (均一 及 
2A 





f(x) = F(x) = lima 0 


并 且 , 我 们 可 以 通过 取 一 个 很 小 的 A 值 并 求解 下 式 来 估计 f(x): 


?Cn = Patat- Fess 5.2] 





CL, Fr) EAH FEAR A EPL tHE 
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Pq =i <= HE 
方程 5. 2 中 的 分 子 就 是 落 在 区 间 [z 一 A,z 十 A] 上 的 数据 点 X; 的 数目 , 密 
度 估计 值 就 是 zx 附近 每 个 单位 长 度 上 的 数据 点 所 占 的 比例 。 
改进 后 的 密度 估计 有 两 个 重要 的 方面 。 第 一 ,刚才 介绍 的 简单 密度 估计 量 
可 以 表达 成 以 下 形式 : 


这 里 ,$ 是 以 如 下 形式 定义 的 函数 : 


1/2 (lu | 过 1 
$u) = 
0 Cw | 1 


即 区 间 L 一 1, 1] 上 的 均匀 概率 密度 函数 。 这 样 的 密度 估计 量 被 称 为 “具有 核 $ 
的 核 密度 估计 量 ”。 在 这 种 情况 下 , 核 是 长 方形 的 。 但 是 , 它 现在 被 理解 成 ,如 
果 我 们 以 一 个 关于 0 对 称 的 修 匀 概率 密度 函数 来 替换 这 个 函数 ,可 以 获取 相当 
大 的 效率 。 第 二 ,常数 A 被 定义 为 估计 量 的 “带宽 ”,A 的 选择 被 证 明 是 很 关键 
的 。 选 择 的 值 太 小 ,会 得 到 一 个 偏 误 低 但 方差 大 的 估计 量 , 而 选择 的 值 太 大 , 则 
会 得 到 方差 小 但 偏 误 高 的 佑 计量。 许多 统计 研究 一 直 关 注 选择 一 个 最 优 带 宽 
的 问题 , 它 将 同时 使 得 偏 误 和 方差 两 者 最 小 化 ( 詹 恩 编写 的 Stata 程序 “reldist” 
提供 了 许多 核 密度 方法 来 估计 相对 概率 密度 函数 )。 对 各 种 方法 的 讨论 超出 了 
本 书 的 范围 。 不 过 ,对 于 读者 而 言 ,重要 的 是 要 明白 ,相对 密度 估计 的 方法 论 大 
大 依赖 于 这 些 基本 观念 。 

基于 应 用 于 黑人 收入 和 白人 收入 这 一 相同 例子 的 Stata 编码 ,我 们 用 相对 
比例 来 对 相对 分 布 方法 举例 说 明 。 首 先 ,我 们 对 黑人 和 白人 内 部 的 收入 数据 加 
以 排序 。 十 分 位 数 将 白人 人 口 区 分 成 10 个 等 规模 的 段 ( 见 表 5. 1 的 前 两 列 )。 
比如 ,白人 中 最 贫穷 的 10% 拥 有 不 到 12580 美元 的 收入 ,而 最 富裕 的 10% 至 少 
拥有 103098 美元 的 收入 。 有 10 个 十 分 位 数 段 :最 小 值 到 12580 美元 、12580 美 
元 到 19828 美元 ,直至 103098 美元 到 白人 收入 的 最 大 值 。 白 人 中 的 10% 落 在 
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每 一 个 十 分 位 数 段 内 。 然 后 ,我们 确定 黑人 在 由 白人 的 十 分 位 数 所 界定 的 各 段 


内 的 各 个 比例 ( 见 第 三 列 ) 。 


白人 的 十 分 位 数 与 黑人 收入 分 布 中 完全 不 同 的 十 分 位 数 相对 应 :白人 的 第 
一 个 十 分 位 数 对 应 着 黑人 的 0. 234 分 位 数 ,而 白人 的 第 九 个 十 分 位 数 则 对 应 着 
黑人 的 0. 968 分 位 数 。 这 意味 着 ,最 贫穷 的 23. 4% 的 黑人 拥有 不 到 12580 美元 
的 收入 ,而 3.1% 的 黑人 (1 — 0. 969) 至 少 拥 有 103098 美元 的 收入 。 现 在 ,我 们 


准备 计算 白人 十 分 位 数 段 上 的 各 个 比例 比 。 


我 们 根据 他 们 各 自 的 各 分 位 数 段 ,得 到 白人 的 比例 和 黑人 的 比例 ,如 第 四 
列 和 第 五 列 所 示 。 然 后 ,我们 取 一 个 黑人 比例 与 对 应 的 白人 比例 的 比值 得 到 
相对 比例 ( 见 第 六 列 )。 相 对 比例 从 第 一 段 上 的 2. 341 下 降 到 最 高 段 上 的 


0.3115 


#5.1 黑人 一 白人 的 相对 比例 :SIPP(2001 年 ) 


白人 收入 的 十 分 位 数 (y) 





最 小 什 
12580 
19828 
26952 
34199 
42165 
51720 
62983 
78067 
103098 
BAH 


资料 来 源 :SIPP。 








累积 比例 ko A 相对 比例 
黑人 白人 黑人 ”黑人 相对 于 白人 

0.0 0. 000 a = 一 

0.1 0. 234 0.1 0. 234 2. 341 
0.2 0. 384 0.1 0. 150 1. 498 
0.3 0, 504 0.1 0, 120 1. 204 
0.4 0. 601 0.1 0, 097 0. 969 
0.5 0, 697 0.1 0. 096 0. 958 
0.6 0. 780 0.1 0. 083 0. 831 
0.7 0. 855 0.1 0. 075 0. 746 
0.8 0. 914 0.1 0. 059 0. 590 
0.9 0. 969 0.1 0. 055 0. 549 
1.0 1. 000 0.1 0, 031 0. 311 


图 5. 2(a) 展 示 了 白人 收入 和 黑人 收入 的 密度 函数 ,明显 具有 不 同 的 中 心 
位 置 和 形状 。 图 5. 2(b) 画 出 了 对 应 十 分 位 数 段 上 的 黑人 对 白人 的 相对 比例 。 
正如 上 面 所 阐明 的 ,我 们 将 绘 出 的 曲线 视 为 对 相对 密度 的 一 个 近似 ,同时 ， 


PETTE | 


我 们 看 到 ,这 一 相对 密度 曲线 是 下 斜 的 , r= 0.4 下 方 出 现 了 比 上 方 更 加 陡 
峭 的 下 降 。 





0 200 400 600 800 


相对 比例 





0 
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 
r 


—=HA -一 -黑人 
(b) 


图 5.2 黑人 一 白人 相对 收入 分 布 :黑人 一 白人 收入 密度 函数 和 黑人 一 白人 相对 比例 


相对 密度 的 分 解 


在 第 2 章 中 ,我 们 介绍 了 有 关 分 布 的 位 置 、 尺 度 和 形状 的 概念 。 以 参照 分 布 
为 基准 , 比 对 分 布 可 被 视 为 是 通过 将 一 些 操 作 应 用 于 参照 分 布 而 得 到 的 一 一 首 
先 应 用 位 置 移动 ,然后 应 用 尺度 改变 ,最 后 是 形状 变化 。 对 相对 分 布 的 研究 相 
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当 于 将 参照 分 布 的 分 位 数 作为 首选 的 测量 单位 。 相 对 密度 分 解 利用 这 一 思路 
来 描述 这 3 种 操作 的 效应 。 

在 我 们 关于 黑人 一 白人 收入 差异 的 例子 中 ,通过 以 白人 收入 分 布 为 参照， 
从 而 使 调整 位 置 的 白人 收入 成 为 比 对 分 布 ,纯粹 的 位 置 移动 能 够 以 相对 密度 的 
形式 描述 。 在 保持 形状 不 变 的 情况 下 ,这 一 位 置 调 整 以 同一 数量 减少 每 个 白人 
家 庭 户 的 收入 ,以 得 到 相同 的 分 布 中 心 。 除 纯粹 的 位 置 移 动 之 外 ,两 个 分 布 在 
形状 上 不 同 ,这 通过 将 黑人 收入 与 位 置 调整 的 白人 收入 加 以 比较 来 反映 。 我 们 
可 以 进一步 将 形状 变化 分 解 到 随 形 状 变化 而 来 的 尺度 改变 中 。 

我 们 以 一 个 简单 的 两 成 分 分 解 为 例 来 说 明 , 这 个 例子 描述 了 将 一 个 参照 先 
做 位 置 移动 ,然后 做 尺度 或 形状 改变 而 得 到 的 比 对 分 布 。 首 先 ,我 们 创建 了 一 
个 密度 函数 为 J 和 累积 分 布 函 数 为 FO 的 调整 位 置 的 参照 随机 变量 YOL。 令 
py Filey 为 Y 和 Y? 的 均值 ,因此 ,调整 均值 的 参照 变量 为 Yo = 如 十 (yx 一 
py)» 而 两 个 分 布 的 形状 仍然 相同 。 我 们 可 以 采用 代数 形式 将 比 对 分 布 的 相对 
密度 (方程 5. 1) 表 达 为 : 


_ FQ) _ fxQ°O) ER) 5, 3] 
PQ) ERMA) * FE (Qlr)) 








g(r) 


总 之 ,整体 相对 密度 为 位 置 移动 的 相对 密度 乘 以 一 个 表达 式 , 该 表达 式 描 
述 了 在 参照 分 布 已 被 移动 位 置 之 后 ,使 两 个 分 布 相 匹配 所 需 的 额外 的 形状 改 
变 。 请 注意 ,所 有 的 相对 密度 都 以 参照 分 布 的 同一 个 第 7 分 位 数 Q?(7) 为 参照 。 

TARGE o eo ya 来 自 参照 总 体 ,而 yio ++ on 来 自 对 比 总 体 ,方程 
5. 2 中 形式 的 分 解 可 以 用 以 上 所 介绍 的 相对 比例 建构 来 进行 。 方 程 5. 2 中 的 每 一 
项 都 可 以 作为 参照 分 布 的 每 一 个 估计 的 十 分 位 数 段 [i/10, i 十 1/10] 上 的 某 一 常 
数 来 进行 估计 ,而 [i/10, ;十 1/10] 上 7 的 相对 密度 表达 式 为 两 个 比 的 积 : 


p se Í 
f° foL 

我 们 为 调整 位 置 的 参照 数据 引入 符号 yl = y HO), 其 中 i 二 1,…， 
m, 因此 ,7 和 如 表示 样本 均值 。 第 一 个 比值 项 为 : 


[5.3] 








2m = 


评估 不 平等 


Ji yh 的 比例 _ 10X Ji Py?) 的 数目 





Ji Py? 的 比例 
其 中 , J; =[Q°G/10), Q°(Gi+1)/10)) , 这 一 比值 项 为 调整 位 置 的 参照 分 布 对 
于 未 调整 参照 分 布 的 相对 密度 的 一 个 估计 值 。 第 二 个 比值 为 : 
Ji 中 yi 的 比例 





Ji P y? 的 比例 


沿用 我 们 有 关 黑 人 一 白人 收入 的 例子 ,我 们 使 用 均值 调整 来 得 到 调整 位 置 
的 白人 收入 分 布 。 黑 人 的 平均 收入 为 18457 美元 , 低 于 白人 的 平均 收入 。 我 们 
将 每 个 黑人 的 收入 减 去 18457 美元 来 构建 调整 位 置 的 白人 收入 , 它 与 黑人 收入 
分 布 具 有 相同 的 均值 ,但 保留 了 原始 白人 收入 分 布 的 尺度 和 形状 。 调 整 位 置 的 
白人 收入 对 于 原始 白人 收入 的 相对 比例 ,以 与 整体 相对 比例 同样 的 方式 来 取得 。 
请 注意 ,黑人 收入 对 于 调整 位 置 的 白人 收入 的 相对 比例 ,以 原始 未 调整 白人 分 布 
的 分 位 数 为 参照 。 我 们 在 表 5. 2 中 对 此 做 了 示例 说 明 。 第 一 列 给 出 了 原始 的 白人 
十 分 位 数 (与 表 5. 1 第 一 列 相同 ) 。 第 二 列 显示 ,与 原始 白人 收入 十 分 位 数 相对 


表 5.2 ”黑人 对 于 调整 位 置 的 白人 的 相对 比例 :SIPP(2001 年 ) 








累积 比例 比例 相对 比例 
白人 收入 的 
十 分 位 数 (y,) 调整 位 置 黑人 调整 位 置 Pan 黑人 相对 于 调整 
的 白人 ci 的 白人 i 位 置 的 白人 

最 小 值 0. 000 0. 000 = = 
12580 0. 358 0. 234 0. 358 0. 234 0. 654 
19828 0. 451 0. 384 0. 093 0. 150 1. 604 
26952 0. 535 0. 504 0. 084 0. 120 1. 434 
34199 0. 610 0. 601 0.075 0. 097 1, 294 
42165 0. 680 0. 697 0. 070 0. 096 1. 366 
51720 0. 751 0. 780 0. 071 0. 083 1.172 
62983 0. 818 0. 855 0. 067 0. 075 1.115 
78067 0. 881 0. 914 0. 063 0. 059 0. 944 
103098 0. 935 0. 969 0. 054 0. 055 1.013 
最 大 值 1. 000 1. 000 0. 065 0. 031 0. 479 


资料 来 源 :SIPP。 
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应 的 调整 位 置 的 白人 收入 的 分 位 数 段 不 再 是 等 规模 的 。 原 始 白人 收入 十 分 位 
数 上 的 黑人 收入 密度 的 结果 与 表 5. 1 中 的 相同 。 黑 人 对 调整 位 置 的 白人 的 相对 
比例 显示 在 该 表 的 最 后 一 列 中 。 

图 5. 3(a) 星 现 了 调整 位 置 的 白人 收入 对 于 白人 收入 的 相对 密度 , 它 刻画 了 
位 置 移动 。 它 表明 ,调整 位 置 的 白人 在 低 端 处 存在 一 个 高 的 集中 。 我 们 将 此 解 





0 0l 0.2 0.3 04 05 0.6 0.7 08 09 1 
P 


一 一 调整 位 置 的 白人 --- 原始 白人 





0 01 0.2 03 0.4 05 06 07 08 09 1 
E 


--- 调 整 位 置 的 白人 
(b) 





图 5.3 分 解 相对 分 布 :SIPP(2001 年 ) 的 黑人 和 白人 收入 (位 置 移动 的 相对 比例 和 形状 改变 的 相对 比例 ) 
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释 为 ,黑人 一 白人 位 置 差异 源 于 在 收入 分 布 的 低 端 尾部 不 成 比例 地 放置 了 更 多 
的 黑人 。 图 5. 3(b) 呈 现 了 黑人 收入 对 于 调整 位 置 的 白人 收入 的 相对 密度 , 它 刻 
画 了 形状 改变 。 形 状 改变 的 相对 比例 在 两 端 尾部 更 低 , 而 在 第 二 个 到 第 五 个 十 
分 位 数 段 上 更 高 。 这 揭示 出 ,黑人 一 白人 尺度 或 形状 改变 促成 了 将 更 多 的 黑人 
划分 成 中 低 收 入 者 。 

根据 这 两 个 相对 比例 ,我 们 准备 对 整体 相对 比例 进行 分 解 ,如 表 5. 3 所 示 。 
在 每 一 分 位 数 段 上 ,整体 比例 为 调整 位 置 的 白人 收入 对 于 原始 白人 收入 的 相对 
比例 和 黑人 收入 对 于 调整 位 置 的 白人 收入 的 相对 比例 的 乘积 。 

同样 的 思路 自然 地 扩展 至 允许 对 整体 相对 密度 进行 三 成 分 分 解 。 我 们 可 
以 顺利 地 将 形状 改变 所 对 应 的 成 分 分 解 成 尺度 改变 和 非 尺 度 的 形状 改变 。 令 





PoLs 为 调整 位 置 和 尺度 的 参照 分 布 的 概率 密度 函数 。 方 程 5. 1 从 而 可 被 扩展 成 
如 下 形式 : 

CD = LLM es sd RO FAO) 2 FEI G9) 

8 FOCO FOCIA) © FLQ) ~~ FSQ (7)) 


[5.4] 
# 5.3 整体 相对 比例 (RP) 分 解 为 位 置 和 形状 改变 的 顺序 分 解 :SIPP(2001 年 ) 
1 2 3 4 5 6 


原始 白人 分 布 ”原始 白人 收入 的 
的 累积 比例 十 分 位 数 





整体 RP ”位置 移 动 形状 改变 (4) x (5) 





0 最 小 值 2. 341 3. 579 0. 654 2. 341 
0.1 12580 1. 498 0. 934 1. 604 1. 498 
0.2 19828 1. 204 0. 840 1. 434 1. 205 
0.3 26952 0. 969 0. 749 1. 294 0. 969 
0. 4 34199 0. 958 0. 701 1. 366 0. 958 
0.5 42165 0. 831 0. 710 1,172 0. 832 
0. 6 51720 0. 746 0. 669 1. 115 0. 746 
0.7 62983 0. 590 0. 625 0. 944 0. 590 
0.8 78067 0. 549 0. 542 1. 013 0. 549 
0.9 103098 0. 311 0. 650 0. 479 0. 311 
1.0 最 大 值 一 一 = = 


资料 来 源 :SIPP。 
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总 之 ,整体 相对 比例 为 位 置 移动 的 相对 密度 、 一 个 描述 尺度 改变 的 密度 比 
值 项 和 一 个 对 位 置 和 尺度 效应 已 被 解释 之 后 所 遗留 的 效应 进行 解释 的 密度 比 
值 项 。 由 于 各 项 是 被 接连 纳入 的 ,其 中 每 一 个 新 的 项 就 针对 分 布 的 额外 修正 加 
以 解释 ,所 以 ,此 分 解 属于 顺序 分 解 。 所 得 到 的 分 解 关 键 取 决 于 各 项 被 纳入 的 
次 序 。 比 如 ,如 果 我 们 先 对 尺度 进行 调整 ,然后 对 位 置 进行 调整 ,结果 将 会 是 完 
全 不 同 的 分 解 。 此 外 ,应 再 次 指出 ,每 一 密度 项 都 以 原始 参照 分 布 的 第 7 分 位 数 
为 其 参数 ,只 有 分 解 式 中 的 第 一 项 比值 才 是 相对 密度 ,因为 在 该 项 中 ,密度 的 参 
数 为 分 母 概率 密度 函数 的 分 位 数 。 

对 于 之 前 的 分 解 (方程 5. 3 ) ,我 们 可 以 使 用 数据 来 将 相对 比例 分 解 成 各 相 
对 比例 项 的 乘积 ,其 中 ,每 一 项 都 源 于 一 个 特定 类 型 的 修正 : 

Ae Rane A 
feo fe” Fac” Fa 

在 三 成 分 分 解 中 ,除了 我 们 现 有 涉及 位 置 以 及 尺度 调整 的 各 项 之 外 ,我 们 
还 需要 计算 计数 的 比值 ,正如 我 们 在 两 成 分 分 解 中 所 做 的 那样 。 尽 管 方程 5. 4 
右边 的 最 后 两 项 由 表 5. 2 中 说 明 的 那样 得 到 ,但 两 项 分 解 中 的 方程 5. 4 处 出 现 
的 各 项 可 像 之 前 那样 计算 得 到 。 方 程 5. 4 第 二 项 分 子 中 的 计数 为 调整 位 置 与 
尺度 的 白人 收入 。 对 于 这 些 计数 ,我 们 将 每 一 个 白人 的 收入 乘 以 黑人 标准 差 对 
于 白人 标准 差 的 比值 ,然后 调整 平均 差 。 比 如 , 令 sy 和 5s9 表示 比 对 和 参照 数据 
的 标准 差 , 那 么 ,调整 位 置 与 尺度 的 参照 数据 变 成 : 


[5.4] 





> 
x 
| 


那么 ,第 二 个 相对 比例 项 具有 以 下 形式 : 


Ji P y9 的 比例 

Ji P y? 的 比例 
继续 关于 黑人 一 白人 收入 的 例子 , 表 5. 4 给 出 了 顺序 三 成 分 分 解 , 首 先 位 置 
移动 (第 四 列 ) ,然后 尺度 改变 (第 四 列 ) ,最 后 非 尺度 的 形状 改变 (第 六 列 )。 图 
5. 4 提供 了 位 置 移动 之 后 的 尺度 改变 和 形状 改变 的 图 形 样式 。 图 5. 4(a) 显示 ， 
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黑人 收入 的 尺度 比 白人 收入 的 更 小 ,集中 在 第 二 个 十 分 位 数 到 第 七 个 十 分 位 数 
这 一 段 上 。 图 5. 4(b) 显 示 , 一 旦 尺度 差异 被 排除 ,黑人 收入 就 比 白人 收入 更 加 
两 极 化 ,因为 更 多 的 黑人 处 在 调整 位 置 和 尺度 的 分 布 的 两 端 。 


表 5.4 整体 相对 比例 (RP) 分 解 为 位 置 .尺度 和 剩余 形状 改变 的 顺序 分 解 :SIPP(2001 年 ) 











1 2 3 4 5 5 6 
0.0 最 小 值 2.341 3.579 0.534 1,226 2. 341 
0.1 12580 1.498 0.934 1.665 0,964 1. 498 
0.2 19828 1.204 0.840 1.677 0,855 1. 204 
0.3 26952 0.969 0.749 1.565 0,827 0. 969 
0.4 34199 0.958 0.701 1.496 0.913 0. 958 
0.5 42165 0.831 0.710 1.341 0.874 0. 831 
0.6 51720 0.746 0.669 1.107 1.007 0. 746 
0.7 62983 0.590 0.625 0.847 1,115 0. 590 
0.8 78067 0.549 0.542 0.681 1.488 0. 549 
0.9 103098 0.311 0.650 0.483 0.991 0. 311 
1.0 最 大 值 = = — 


资料 来 源 :SIPP。 





0 01 0.2 0.3 0.4 0.5 0.6 0.7 08 09 1 


r 





调整 位 置 和 尺度 的 白人 --- 调整 位 置 的 白人 
(a) 


531 


社会 科学 中 的 数理 基础 及 应 用 
532 | 








1 1 上 1 上 1 L —1_i1____i M 
0 01 02 0.3 0.4 05 06 0.7 08 09 1 


一 一 黑人 --- 调整 位 置 和 尺度 的 白人 
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图 5.4 整体 相对 分 布 分 解 为 位 置 、 尺 度 和 剩余 形状 改变 的 顺序 分 解 : 
黑人 和 白人 收入 (尺度 改变 的 相对 比例 和 非 尺度 的 形状 改变 的 相对 比例 ) 


尽管 密度 比 和 分 解 给 我 们 提供 了 比较 两 个 分 布 和 理解 这 些 分 布 之 间 差 异 
来 源 的 工具 ,但 是 有 两 个 特殊 的 概要 测量 可 用 来 简洁 地 刻画 差异 的 特征 。 下 一 
节 , 我 们 将 继续 讨论 相对 粹 和 中 位 相对 极 化 (MRP)。 


相对 分 布 的 概要 测量 


概括 相对 密度 的 测量 将 有 助 于 对 我 们 的 许多 研究 问题 提供 间接 的 答案 。 
比如 ,黑人 和 白人 收入 分 布 之 间 的 分 化 程度 有 多 大 ? 当 与 参照 分 布 相 比 较 时 ， 
比 对 分 布 是 如 何 被 两 极 化 的 ? REAM MRP 可 被 用 来 回答 这 些 问 题 。 


相对 炳 


在 第 3 章 中 ,我们 介绍 了 分 配 不 平等 的 各 种 测量 ,比如 泰 尔 指 数 和 广义 箭 测 
量 。 这 些 量 测量 了 单一 分 布 的 内 在 不 平等 程度 。 替 代 方 法 之 一 是 测量 相对 于 
某 个 参照 分 布 的 不 平等 。 为 此 ,我 们 引入 “相对 炉 ” 的 概念 。 给 定 具 有 正 相对 概 
率 密 度 函 数 g 的 比 对 和 参照 分 布 ,相对 炳 被 定义 为 ; 
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1 ~- 
| _ Sloe dr [5.5] 


WE PETAR AA TIRE. BE AF It Pe as RN — PH A 
REHE., HG. EB OL PAY cE TT EOS. 5 中 有 一 个 负 号 ， 
Plt iS at TT SRA. BERRA ENDTE 5.5 中 的 符号 ,但 当 我 
{TVA BS OY is SR HEE TT RY BE FR EEE TY TT AR E 
一 些 关键 的 技术 问题 ,因为 当 区 间 大 小 减少 至 0 时 ,我 们 倾向 于 执行 的 求 极限 的 
操作 导致 忽略 了 趋 于 无 穷 的 一 项 。 

理解 方程 5. 5 的 更 好 的 方法 是 使 用 一 个 分 布 和 另 一 个 分 布 的 库 尔 贝 克 - 莱 
伯 勤 距离 概念 ,随后 对 其 进行 介绍 。 设 想 我 们 有 一 个 观测 样本 Yis es Yn, H 
我 们 想 检 验 的 零 假设 为 该 样本 取 自 一 个 概率 密度 函数 为 p 的 分 布 P, 针 对 的 备 
择 假设 为 该 样本 取 自 一 个 概率 密度 函数 为 q 的 分 布 Q。 尼 曼 -皮尔 逊 定理 告诉 
我 们 , 任 一 给 定 水 平 a 上 最 有 效力 的 检验 为 拒绝 零 假 设 的 似 然 比 检验 (Neyman 
&. Pearson, 1933) ,前 提 是 对 数 似 然 值 


Leet: ) 
Iie 


超过 取决 于 a 的 某 一 常数 cc。 对 数 似 然 值 为 独立 同 分 布 随机 变量 的 和 ,因此 ， 
若 假定 备 择 假设 为 真 , 当 样本 规模 趋 于 无 穷 大 时 ,我 们 可 以 用 大 数 定 律 得 到 : 


DRA w f loeli) l- | log ( 265 Jara 








log A = log 








= X log( 45) 


i=l 


当 q REF p 时 ,我 们 预计 似 然 比 通常 取 接 近 1 的 值 。 因 此 ,该 值 超 过 1 的 
程度 就 由 最 后 的 积分 来 进行 测量 ,该 积分 被 定义 为 P 距 Q 的 库 尔 贝 克 - 莱 伯 勒 
距离 , 记 为 D(P, Q) (Kullback & Leibler, 1951; Soofi, 1994)。 我 们 可 以 证 明 ， 
该 量 是 非 负 的 , 当 且 仅 当 两 个 分 布 重合 时 才 取 零 值 。 我 们 将 库 尔 贝 克 - 莱 伯 勤 
距离 用 于 测量 已 距 Q 有 多 远 。 不 过 ,将 这 理解 为 “距离 ”时 要 着 慎 , 因 为 ,如 
D(P; Q) = D(Q; P) 通常 并 非 如 此 。 

回 到 相对 焙 ( 方 程 5. 5) ,我 们 用 方程 5. 1 将 其 重新 写成 如 下 形式 : 
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| FQN) | (Lau jar 
nieo og( fo(Qo(r)) 


改变 一 下 变量 y= Qo(r), 得 到 ”= Foly) Al dr = fo(y)dy。 此 表达 式 具 有 如 
FÉR: 


oo 


E eh log( Fos) 


即 Fo 距 下 的 库 尔 贝 克 - 莱 伯 勒 距离 。 
以 十 分 位 数 段 上 相对 比例 的 形式 来 表达 相对 炉 就 非常 直接 明了 。 我 们 可 
将 方程 5. 5 写 为 


fo(ydy = D(Fo; F) [5.5] 





D(F : Fo) = S (5t ioe (58 )P? 


继续 我 们 有 关 黑 人 和 白人 收入 的 例子 ,我 们 用 方程 5. 5 计算 出 2001 年 的 整 
PAF HAY 0. 137. 

REL HBAS — AEK BBR BG» X AT WA GEL BU) Se R J PEE E EP 
响 的 不 变性 。 如 果 一 个 分 布 是 通过 打 乱 概率 质量 而 由 另 一 分 布 得 到 的 ,两 个 
不 同 的 相对 分 布 将 具有 相同 的 焙 。 更 精确 地 讲 , 如 果 & 是 相对 密度 , 且 对 于 某 
一 保 测 函数 [D3]:[0, 1] 一 [0, 1], A eM = gh), 那么 ,HB 和 gg 具有 相同 
的 相对 箭 。 因 此 ,如 果 考 虑 gs 在 每 一 个 十 分 位 数 段 上 为 常数 的 情形 , 若 g 在 第 
+ ar ieee [G—1)/10, 1/10) 上 取 值 gi;, HA i= 1, …, 10, 且 8 也 取 相 同 
的 值 , 但 两 者 处 在 不 同 的 十 分 位 数 段 上 ,那么 ,各 十 分 位 数 段 被 重新 排序 ,上 和 
g 的 相对 粹 仍然 相同 。 因 此 ,相对 密度 中 峰 和 谷 的 实际 位 置 , 对 其 相对 粹 并 没有 
影响 。 


相对 极 化 


如 果 一 个 分 布 存在 向 尾部 而 不 是 中 部 集中 的 倾向 ,那么 , 它 就 被 说 成 是 极 
化 的 。“ 极 化 ”是 刻画 一 个 分 布 的 尺度 或 形状 的 男 一 种 方式 ,而 且 这 种 刻画 可 以 
是 相 比 而 言 的 。 我 们 经 常 问 ,一 个 比 对 分 布 是 否 比 参照 分 布 伸展 得 更 宽 ( 更 罕 ) 
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或 具有 更 重 ( 更 轻 ) 的 尾部 ”比如 ,我 们 想 知道 , 当 与 白人 收入 分 布 进行 比较 时 ， 
黑人 收入 分 布 是 否 更 不 伸展 且 集 中 在 下 半 部 ( 即 朝 该 分 布 的 中 位 数 集中 )? 相 
对 烂 并 不 能 提供 这 一 问题 的 答案 。 

MRP 指数 是 一 把 有 关 比 对 分 布 的 更 为 极 化 程度 的 测量 工具 。 它 被 以 比 对 
分 布 相对 于 调整 位 置 的 参照 分 布 的 相对 分 布 形式 来 定义 ,这 里 的 参照 分 布 属于 
调整 中 位 数 的 分 布 ,因此 ,两 个 分 布 的 中 位 数 相同 (中 位 数 调整 优 于 均值 调整 ， 
由 于 均值 在 偏 态 分 布 情况 下 的 缺陷 ) 。 我 们 用 符号 Ro 表示 一 个 随机 变量 , 它 的 
分 布 是 比 对 分 布 和 参照 分 布 之 间 的 相对 分 布 。 此 随机 变量 可 被 理解 成 调整 位 
置 的 参照 分 布 中 ,等 于 或 小 于 某 一 个 从 比 对 分 布 中 随机 抽取 的 值 的 人 口 所 占 的 
比例 。 然 后 ,我 们 以 绝对 值 来 测量 RQ 平均 偏离 1/2 多 远 , 并 通过 下 式 将 相对 极 
化 定义 成 该 均值 的 一 个 线性 变换 : 

MRP(F; F?) = 4EC| Ro, — 1/2 1] 一 1 [5. 6] 


我 们 选择 此 线性 变换 (期 望 偏差 的 4 倍 减 1) ,得 到 一 个 取 值 在 一 1 到 1 之 间 
的 指数 。 考 虑 一 些 更 重要 的 特例 会 增加 这 一 指数 的 可 解释 性 。 如 果 两 个 分 布 
在 经 过 位 置 调整 后 重合 在 一 起 ,那么 ,正如 前 面 指出 的 ,Rai 在 区 间 [L0, 1] 上 具有 
均匀 分 布 , 且 在 这 种 情况 下 , EL| RoL 一 1/2 |] = 1/4, 这 使 得 MRP 指数 等 于 0。 
不 存在 相对 极 化 的 最 极端 情形 为 , 比 对 人 口 在 参照 人 口 的 中 位 数 上 集中 。 在 这 
种 情况 下 ,Ro 是 一 个 取 值 为 1/2 的 常数 随机 变量 ,因此 , EL| Ro. 一 1/2 |] =0， 
这 使 得 MRP 等 于 一 1。 最 后 ,相对 极 化 的 最 极端 情形 为 ,一 半 的 比 对 人 口 具有 
与 参照 人 口 的 最 小 值 相 等 的 取 值 ,而 另 一 半 则 具有 与 参照 人 口 的 最 大 值 相等 的 
取 值 。 在 这 种 情况 下 ,RoL 以 1/2 概率 取 0 值 ,1/2 概率 取 1 值 ,使 得 | Ror — 1/2 | 
成 为 一 个 等 于 1/2 的 常数 随机 变量 。 这 时 , E[ | RoL —1/2 |] = 1/2, 那么 我 们 
看 到 ,MRP 的 取 值 为 1。 

一 个 大 于 0 的 MRP 表明 ,比较 组 比 参照 组 更 极 化 ,而 一 个 小 于 0 的 MRP 
则 表明 ,比较 组 比 参照 组 更 不 极 化 。 因 此 ,MRP 提供 了 与 被 比较 分 布 的 上 半 
部 .下 半 部 上 差 值 的 方向 和 数量 有 关 的 信息 。 

MRP 指数 的 取 值 可 被 理解 成 人 口 从 更 中 心 位 置 到 更 不 中 心 位 置 的 一 个 比 
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例 改变 。 比 如 ,黑人 一 白人 收入 比较 的 MRP 为 一 0. 2299, 这 意味 着 ,与 白人 家 
庭 户 比 起 来 ,22. 99% 的 黑人 家 庭 户 朝 中 位 数 集中 。 这 似乎 反映 出 ,白人 的 收入 
尺度 比 黑 人 的 收入 尺度 更 宽 。 

基于 数据 来 计算 MRP 可 描述 如 下 。 令 m 和 m0 分 别 表示 比 对 和 参照 分 布 
的 样本 中 位 数 。 对 于 i 二 1，…， n, 调整 中 位 数 的 参照 数据 为 y = 多 + Gn — 
m°), XF i= 1, cers n, 我 们 使 用 经 验 等 级 转换 来 将 这 些 值 转化 成 相对 调整 中 
位 数 的 数据 7; = FO (yi), 即 取 值 小 于 或 等 于 y; 的 调整 中 位 数 的 参照 数据 点 的 
比例 ,得 到 样本 MRP X: 


MRP 一 全 (2 17—1/21)-1 [5. 6] 


MRP 指数 具有 其 他 重要 性 质 。 具 体 而 言 , 它 是 反对 称 的 ,意味 着 调换 比 对 
和 参照 将 得 到 一 个 大 小 相同 而 符号 相反 的 指数 。 为 了 理解 这 点 ,请 参看 图 5. 5， 
它 针 对 具有 相同 中 位 数 的 比 对 和 参照 分 布 的 模拟 选择 , 画 出 了 一 个 GC) 的 示例。 
中 位 数 相同 的 事实 确保 该 函数 的 图 形 通过 单位 正方 形 的 中 心 点 (1/2，1/2)。 如 果 
我 们 令 r AKEL, 1 服从 均匀 分 布 的 随机 变量 ,那么 ,Q(r) 的 分 布 就 是 从 比 对 
分 布 中 抽样 得 到 的 随机 变量 Y 的 分 布 ,同时 , F° (Q(r)) 具 有 随机 变量 R 的 分 
布 。 因 此 ,我 们 可 以 写 为 : 


E|R—1/2\= | | F(Q(r)) —1/2 | dr 


r=0 


此 积分 在 图 中 被 表示 成 以 竖 条 填充 的 面积 。 但 是 ,如 果 我 们 将 参照 和 比 对 
分 布 对 调 ,正如 前 面 看 到 的 ,我们 将 得 到 一 个 随机 变量 RR, 其 分 布 是 新 的 相对 分 
布 , 且 其 累积 分 布 函数 为 尺 的 累积 分 布 函 数 的 逆 。 此 外 ,|R 一 1/2 | 为 以 横 条 
填充 的 面积 。 显 然 ,这 两 块 面积 之 和 为 1/2。 因 此 ,我 们 可 以 写 为 : 


E| R—1/2 |+E | R— 1/2 |= 1/2 
另外 ， 


GE | R—1/2 | 一 1) + G4E | R—1/2 | 一 1) = 41/2) —2 = 0 
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也 就 是 说 ,这 两 个 MRP 指数 的 和 为 0, 换 言 之 , MRP(F; P) =— MRPC(F°; P). 
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5.5 ”中 位 数 相 对 极 化 对 称 性 的 示例 说 明 


MRP 的 一 个 可 能 缺陷 仅仅 在 于 , 它 未 揭示 分 布 的 哪 一 个 尾部 是 极 化 的 来 
源 。 为 了 消除 这 点 ,MRP 可 被 分 解 成 下 部 和 上 部 极 化 。 这 要 求 我 们 针对 调整 
位 置 的 相对 分 布 的 下 半 部 和 上 半 部 分 别 进 行 计算 。 在 图 5. 5 中 ,这 相当 于 用 左 
下 角 正 方形 中 以 横 条 填充 的 部 分 计算 下 部 相对 极 化 (LRP) ,并 用 右上 和 角 正 方形 
中 的 部 分 计算 上 部 相对 极 化 (URP)。 那 么 , MRP 可 被 加 和 分 解 成 LRP 
和 URP: 


MRP(F; F°) = > LRPCF: F?) + SURPCF; F?) [最 


就 数据 而 言 ,将 调整 中 位 数 的 相对 数据 以 升序 排序 之 后 ,LRP 和 UPR 可 被 
计算 如 下 : 


n/2 

LRPCF; F°) = È ( $5 (2 一 天 )) 一 1 

URPCF; F = 8 ( 3) ( 产 一 /2)) 一 1 (5.97 
i=n/2+1 


我 们 用 “reldist”(Jann，2008) 来 得 到 这 些 极 化 测量 。 在 比较 2001 年 的 黑人 
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收入 和 白人 收入 的 过 程 中 ,我 们 发 现 , MRP 在 两 个 尾部 并 不 是 均匀 分 布 的 。 
LRP =— 0. 3152, 为 URP =— 0. 1447 的 一 2 倍 。 因 此 ,黑人 家 庭 户 的 下 半 部 分 
具有 比 白 人 下 半 部 分 更 罕 的 宽度 。 下 半 部 分 中 大 约 16% (LRP 的 一 半 ) 的 黑人 
朝 中 位 数 集中 。 黑 人 家 庭 户 的 上 半 部 分 与 白人 家 庭 户 更 相似 ,其 中 只 有 约 7% 
的 家 庭 户 朝 中 位 数 集中 。 综 合 起 来 ,我 们 可 以 看 到 ,黑人 的 分 布 比 白人 的 分 布 
更 加 右 偏 。 


相对 分 布 的 趋势 


相对 分 布 方法 创建 了 相对 数据 ,该 数据 提供 了 分 析 不 平等 的 更 大 的 灵活 
性 。 比 如 ,我 们 很 想 知道 ,黑人 一 白人 收入 分 布 差异 如 何 随 着 时 间 演 变 。 我 们 
是 否 看 到 黑人 一 白人 收入 差异 在 经 历 了 20 世纪 70 年 代 的 扩大 之 后 ,出 现 了 一 
个 停滞 ? 我们 可 以 用 黑人 一 白人 相对 密度 和 顺序 分 解 来 提供 图 形 考察 ,并 可 以 
用 相对 箭 来 了 解 整体 分 化 ,用 MRP 及 其 分 解 来 了 解 相 对 极 化 。 


表 5.5 HANH: 1985—2001 年 黑人 一 白人 收入 分 化 趋势 











年 份 RE 年 份 FAXT 

1985 0. 184 1993 0. 170 

1987 0. 241 1995 0. 166 

1988 0. 180 1996 0. 140 

1991 0. 199 2001 0. 137 
资料 来 源 :SIPP。 


基于 十 分 位 上 的 相对 比例 ,我 们 计算 8 个 调查 年 份 每 一 年 的 相对 入 指数 , 结 
果 显 示 在 表 5. 5 中 。1987 年 出 现 了 最 大 的 黑人 一 白人 收入 分 化 , 1996 年 和 
2001 年 分 化 最 小 。 

接 下 来 ,我 们 比较 黑人 和 白人 分 布 之 间 的 极 化 。 与 表 5. 5 中 单一 年 份 的 说 
明 一 样 ,我 们 使 用 中 位 数 调 整 ,同时 用 reldist(Jann，2008) 得 到 中 位 数 、 下 端 尾 
部 和 上 端 尾 部 的 相对 极 化 指数 。 因 为 该 方法 比较 集中 关注 调整 中 位 数 后 的 形 
状 差异 ,因此 ,相对 极 化 概括 了 尺度 改变 和 形状 改变 。 相 对 极 化 提供 了 相对 箭 
中 未 揭示 的 黑人 和 白人 分 布 尾部 之 间 差 异 的 数量 和 方向 的 信息 。 结 果 见 表 5. 6 
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和 图 5. 6。 最 显著 的 模式 是 MRP 和 LRP 随时 间 推 移 而 波动 ,而 URP 相对 保持 
不 变 。 图 5. 6 直观 地 显示 了 URP 的 稳定 性 和 LRP 的 波动 ,这 一 波动 影响 着 整 
体 相 对 极 化 MRP 的 波动 。 


表 5.6 中 位 数 相 对 极 化 (MRP) 及 下 部 和 上 部 成 分 : 
1985 一 2001 年 黑人 一 白人 收入 极 化 趋势 





年 份 MRP LRP URP 

1985 一 0. 2321 一 0. 3112 一 0. 1529 
1987 一 0. 2547 一 0. 3648 一 0. 1445 
1988 一 0. 2060 一 0. 2907 一 0. 1214 
1991 一 0. 2407 一 0. 3408 一 0. 1407 
1993 一 0. 2145 一 0. 3003 一 0. 1286 
1995 一 0. 2195 一 0. 3217 一 0. 1173 
1996 一 0. 2429 一 0. 3708 一 0. 1150 
2001 一 0. 2299 一 0. 3152 一 0. 1447 


注 : MRP = 0. 5(LRP + URP), LRP: 下 部 相对 极 化 ;URP: 上 部 相对 极 化 。 
资料 来 源 :SIPP。 





1985 1990 1995 2000 
Eh 


— MRP ===, SX LRP -—-—0.:5 X URP 


图 5.6 1985—2001 年 黑人 一 白人 收入 中 位 数 及 下 部 和 上 部 极 化 的 变动 趋势 


相对 分 布 分 解 方 法 如 何不 同 于 第 4 章 中 所 介绍 的 基尼 分 解 等 概要 不 平等 测 
量 分 解 呢 ? 我 们 强调 了 由 合并 两 个 分 布 的 相对 分 布 方法 所 提供 的 许多 机 会 。 
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相对 分 布 方法 在 概括 两 个 分 布 的 分 化 和 极 化 方面 很 灵活 。 这 些 量 对 横断 面 和 
时 间 趋 势 研究 都 很 有 用 ,它们 提供 了 补充 已 有 概要 不 平等 测量 的 不 平等 替代 测 
量 。 比 如 ,更 大 的 相对 焙 表 明 比 较 和 参照 组 之 间 更 大 的 不 平等 。 极 化 指数 提供 
了 对 下 尾部 和 上 尾部 敏感 的 测量 , 而 概要 不 平等 测量 只 对 某 一 尾部 (或 者 底部 
或 者 顶部 ) 敏 感 。 

以 这 些 发 现 , 我 们 就 有 能 力 回答 本 章 开篇 我 们 提出 的 那 两 个 问题 。1985 年 
到 2001 年 的 17 年间, 黑人 一 白人 收入 分 化 的 波动 起 伏 ,主要 归 因 于 黑人 收入 分 
布下 半 部 分 的 波动 。 


小 结 


相对 分 布 分 解 方法 如 何不 同 于 第 4 章 中 所 介绍 的 概要 不 平等 测量 ? 我 们 展 
示 了 由 合并 两 个 分 布 的 相对 分 布 方法 所 提供 的 机 会 。 相 对 分 布 方法 在 将 整体 
差异 分 解 为 位 置 及 斥 度 和 形状 改变 方面 很 灵活 。 相 对 箭 不 同 于 之 前 所 讨论 的 
BEAR TS A ty” RTE BC SE BEA HA AS iY PEE o 
MRP 及 其 LRP 和 URP 成 分 特别 有 用 ,因为 它们 在 排除 中 位 数 影响 的 情况 下 ， 
对 两 个 分 布 的 形状 加 以 比较 ,并 强调 了 两 个 尾部 。 我 们 已 经 使 用 人 口子 群体 
(黑人 相对 于 白人 ) 进 行 了 举例 说 明 。 但 是 ,相对 分 布 方法 的 应 用 通常 可 以 很 广 
泛 , 而 MRP 尤其 如 此 。 我 们 可 以 直接 将 这 些 基于 相对 分 布 的 方法 用 于 空间 比 
较 , 比 如 ,美国 内 部 跨 区 域 的 比较 或 者 跨国 比较 ,以 及 时 间 上 的 比较 。 

到 目前 为 止 ,本 书 中 所 有 的 说 明 性 例子 都 将 经 验 数据 近似 看 成 整个 总 体 。 
样本 变异 会 导致 不 精确 的 估计 值 。 为 了 避免 将 随机 干扰 理解 成 真实 模式 ,我 们 
必须 处 理 不 平等 测量 的 推断 问题 ,这 是 下 一 章 的 主题 。 


li 


在 许多 研究 中 ,研究 者 只 能 得 到 样本 数据 而 不 是 整个 总 体 。 而 且 , 全 国 性 
调查 数据 通过 使 用 多 阶段 整 群 分 层 抽样 等 复杂 抽样 设计 的 调查 来 收集 ,因此 ， 
总 体 中 的 个 体 经 常 但 并 不 总 是 具有 不 同 的 被 抽取 概率 。 因 此 ,针对 某 一 反应 变 
量 的 不 平等 测量 做 推断 ,就 会 受到 比 在 简单 随机 抽样 情况 下 更 复杂 的 抽样 变异 
的 影响 。 另 外 ,由 于 几乎 所 有 的 不 平等 测量 都 是 结果 变量 的 非 线性 函数 ,因此 ， 
线性 化 方法 被 用 来 推导 更 复杂 的 标准 误 ,尽管 考虑 了 调查 抽样 设计 。 最 后 , 当 
样本 规模 较 小 的 时 候 , 线 性 化 方法 及 其 渐 近 假定 可 能 是 有 问题 的 ,需要 采用 替 
代 方 法 来 量化 抽样 变异 。 这 些 问 题 将 在 本 章 中 加 以 讨论 。 

不 平等 测量 ,特别 是 基尼 系数 、 泰 尔 指 数 和 阿 特 金森 族 ,在 趋势 研究 (比如 ， 
比较 不 同时 间 上 的 收入 不 平等 ) .比较 研究 (比如 ,比较 不 同 国家 的 收入 不 平等 ) 
和 政策 研究 (比如 ,比较 各 种 税收 政策 再 分 配 的 效果 ) 中 被 广泛 使 用 。 当 进行 此 
类 比较 时 ,统计 显著 性 就 变 成 了 一 个 经 常 被 忽视 的 重要 问题 。 本 章 将 处 理 与 不 
平等 测量 和 相对 分 布 测量 有 关 的 推断 问题 。 

宽泛 地 讲 , 有 两 种 方法 一 一 渐 近 的 和 自 举 的 一 一 被 用 来 处 理 不 平等 测量 的 
推断 。 渐 近 法 建立 在 抽样 分 布 的 正 态 渐 近 基 础 上 。 基 于 渐 近 理论 的 渐 近 标准 
误 (ASE) 和 置信 区 间 在 小 样本 情况 下 可 能 是 有 偏 的 ,而 且 这 些 估计 值 的 小 样本 
属性 通常 是 未 知 的 。 自 举 法 使 用 500 到 2000 个 从 实际 样本 得 到 的 自 举 法 抽取 
样本 来 估计 抽样 分 布 。 自 举 法 推论 统计 量 包 括 自 举 法 标准 误 (BSE) 和 置信 区 
间 , 可 应 用 于 相对 较 小 的 样本 ,因为 它 没有 做 渐 近 假定 (Burr，1994; Hall, 
1992) 。 假 定 两 种 方法 采用 简单 随机 抽样 ,因此 ,两 者 都 需要 进行 修改 以 适用 于 
复杂 调查 抽样 设计 的 情形 。 
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杜 克 罗 斯 和 阿拉 尔 提出 了 选取 某 一 方法 的 一 般 性 原则 (Duclos & Araar， 
2006) 。 当 观测 案例 数 较 大 并 且 概 要 不 平等 测量 估计 量 的 抽样 分 布 趋 于 正 态 
时 ,我们 可 以 放心 地 使 用 渐 近 法 , 它 会 得 到 与 自 举 法 几乎 相同 的 结果 。 但 是 ,如 
果 估 计量 的 抽样 分 布 远 不 是 正 态 的 , 渐 近 法 会 得 到 有 偏 的 标准 误 和 置信 区 间 。 

本 章 将 渐 近 法 和 自 举 法 两 者 引入 单一 分 布 的 概要 不 平等 测量 或 相对 分 布 
中 来 。 这 些 方 法 可 以 考虑 调查 抽样 设计 。 我 们 将 使 用 SIPP 中 的 收入 和 财富 数 
据 作为 经 验 例子 来 说 明 。 


含 调查 设计 效应 的 渐 近 方法 


杜 克 罗 斯 和 阿拉 尔 的 书 提供 了 一 个 Stata 程序 ,该 程序 在 考虑 调查 抽样 设 
计 的 情况 下 来 估计 基尼 系数 . 阿 特 金 森 族 .广义 炉 族 ,分 位 数 比 和 份额 以 及 它们 
的 ASE 和 置信 区 间 。 将 该 方法 应 用 于 经 验 例子 之 前 ,我 们 对 取 自 他 们 著作 的 一 
些 基 本 原理 加 以 回顾 。 

根据 杜 克 罗 斯 和 阿拉 尔 的 著作 ,按照 大 数 定律 和 中 心 极限 定理 ,有 可 能 证 
明 上 面 提 到 的 大 多 数 不 平 等 测量 都 是 一 致 旦 服从 渐 近 正 态 分 布 的。 一致 性 说 
的 是 , 随 着 样本 规模 趋 于 无 穷 ,估计 量 会 接近 于 真实 的 总 体 参数 。 渐 近 正 态 性 
说 的 是 ,对 于 大 样本 而 言 , 估 计量 的 抽样 分 布 是 渐 近 正 态 的 。 两 位 作者 使 用 一 
种 标准 的 线性 化 方法 来 推导 这 些 不 平等 测量 的 标准 误 。 这 一 方法 确保 了 一 个 
给 定 的 不 平等 测量 的 线性 渐 近 具 有 一 个 近似 正 态 的 分 布 ,其 中 ,分 布 的 均值 由 
真实 的 总 体 参数 近似 地 给 出 ,而 方差 可 以 根据 数据 一 致 地 估计 而 得 到 。 

复杂 调查 抽样 设计 能 够 影响 不 平等 测量 的 标准 误 的 精度 。 美 国 的 全 国 代 
表 性 样本 通常 使 用 多 阶段 整 群 分 层 抽样 设计 。 集 群 一 -比如 ,城市 统计 区 
(MSA) 一 一 在 其 内 部 的 总 体 元 素 之 间 比 在 集群 之 间 更 为 异 质 。 但 是 , 层 在 层 
内 比 在 层 间 更 加 同 质 。 整 群 抽样 相当 于 使 用 一 个 加 权 抽样 方案 来 选取 想 要 包 
含 的 集群 ,而 分 层 抽样 通常 涉及 包含 的 所 有 层 。 比 如 ,对 于 一 项 收入 的 种 族 
差异 研究 而 言 ,MSA 可 能 根据 黑人 居民 的 百分比 来 分 层 ,那些 黑人 比例 较 高 
的 MSA 可 被 过 度 抽样 ,因此 , 比 实际 情况 下 更 多 的 黑人 受 访 者 被 包含 在 最 终 
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样本 中 。 

只 选择 某 些 集群 会 得 到 一 个 不 如 总 体 那么 多 样 的 样本 ,而 且 这 是 在 估计 不 
平等 测量 的 方差 中 需要 加 以 说 明 的 。 同 样 ,随机 选取 层 内 的 元 素 在 本 质 上 有 和 别 
于 简单 随机 抽样 ,而 且 这 一 抽样 设计 也 必须 加 以 说 明 。 多 阶段 整 群 分 层 抽 样 设 
计 有 时 候 会 导致 总 体 元 素 之 间 不 相等 的 人 选 概率 。 入 选 概 率 的 倒数 为 抽样 权 
重 ,表示 一 个 样本 元 素 所 代表 的 总 体 元 素 的 个 数 。 不 平等 测量 意 在 概括 总 体 层 
次 上 的 属性 ,但 是 如 果 未 能 考虑 抽样 权重 ,就 只 能 对 样本 进行 描述 了 。 因 此 , 抽 
样 权 重 必须 被 用 来 对 偏 误 进行 修正 。 

我 们 使 用 SIPP 数据 来 举例 说 明 复 杂 抽 样 设计 。SIPP 采用 分 层 两 阶段 整 
群 抽样 设计 。 由 于 人 口 学 和 社会 经 济 变 量 的 多 样 化 , 层 被 通过 对 区 域 ( 东 北部 、 
中 西部 、 南 部 和 西部 ) 内 的 小 县 城 进 行 分 组 来 构建 得 到 。 在 整 群 抽样 的 第 一 阶 
段 中 ,初级 抽样 单位 (PSU) 为 集群 (县 、 独 立 市 和 县 群 )。PSU 的 样本 从 县 群 的 
每 一 层 中 抽取 ,同时 ,所 有 的 大 县 和 独立 市 都 被 纳入 。 在 第 二 阶段 中 ,从 每 一 个 
选中 的 PSU 中 选取 家 庭 户 。 公 用 SIPP 数据 中 的 PSU 和 层 变 量 为 准 测量 ,以 避 
免 识 别 出 小 地 理 区域 和 小 样本 个 体 的 可 能 。 在 公用 SIPP 数据 中 ,对 于 SIPP 
1991 年 的 数据 , 层 的 数量 为 73 个 ,PSU 的 数量 为 144 个 。 对 于 SIPP 2001 年 的 
数据 ,对 应 的 数字 为 105 和 201。 分 层 整 群 抽样 导致 被 选中 的 家 庭 具 有 不 同 的 
抽样 权重 。 此 外 ,并 非 所 有 被 抽 中 的 家 庭 户 都 愿意 参与 调查 ,同时 ,第 一 波 中 的 
那些 参与 者 也 并 非 都 能 被 追踪 到 。 无 应 答 率 和 失 访 (退出 ) 率 也 会 影响 选中 家 
庭 户 的 最 终 抽 样 权 重 。 

DASP 程序 , 即 分 布 分 析 的 Stata 程序 (Duclos & Araar, 2006) ,可 用 来 免 
费 取得 单一 不 平等 测量 和 两 个 总 体 在 一 个 不 平等 测量 上 的 差异 的 渐 近 推断 。 
DASP 能 够 很 轻易 地 被 安装 到 Stata 中 , 它 能 够 提供 对 大 部 分 标准 不 平等 测量 
的 调查 抽样 设计 进行 解释 的 ASE。 

表 6. 1 的 第 二 部 分 给 出 了 收入 不 平等 测量 的 估计 值 。 其 顶部 呈现 了 未 加 权 
估计 值 及 假定 简单 随机 抽样 下 的 标准 误 和 置信 区 间 , 底 部 呈现 了 加 权 估计 值 及 
意 在 对 项 部 预料 到 的 偏 误 进行 修正 的 标准 误 和 置信 区 间 。 比 如 ,未 加 权 的 基尼 
为 0. 423 ,大 于 加 权 的 基尼 (0. 422) 。 未 加 权 估 计 值 的 向 上 偏 误 存在 于 所 有 中 部 
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或 顶部 敏感 的 测量 中 。 不 过 ,未 加 权 的 底部 敏感 测量 ,z10/250、GE-1 和 A2 都 
是 向 下 有 偏 的 ,而 且 此 偏 误 要 比 中 部 或 项 部 敏感 不 平等 测量 中 的 偏 误 更 大 。 

既然 假定 了 简单 随机 抽样 , 项 部 的 标准 误 估计 值 也 将 是 倾向 于 有 偏 的 。 我 
们 需要 纳入 与 调查 设计 有 关 的 信息 ,包括 整 群 抽样 信息 (PSU) 和 分 层 抽样 信息 
(STRATA)。 使 用 DASP 中 适合 于 该 调查 设计 的 渐 近 方 法 , 表 6. 1 的 底部 呈现 
了 比 顶 部 更 大 的 标准 误 和 更 宽 的 置信 区 间 估 计 。 比 如 ,简单 随机 抽样 假定 下 的 
基尼 系数 的 95 办 置信 区 间 为 [0. 420，0. 427 ]。 抽 样 设计 被 考虑 之 后 ,95% 置 信 
区 间 变 成 了 [0. 417, 0. 427]。 抽 样 变 异 差异 对 中 部 敏感 测量 似乎 更 小 ,而 对 底 
部 或 顶部 敏感 测量 似乎 更 大 ,尤其 是 GE-1. 


表 6.1 收入 不 平等 测量 的 估计 值 和 推断 :SIPP(2001 年 ) 





测 量 估计 值 标准 误 95% 置 信 区 间 

未 考虑 调查 的 未 加 权 结 果 

基尼 0. 423 0. 002 0. 420 0. 427 
p10/p50 0. 281 0. 003 0. 275 0. 288 
p90/ p50 2.510 0. 019 2. 473 2. 547 
GE_, 3.512 0. 766 2. 010 5. 014 
GE, 0. 349 0. 004 0. 342 0. 356 
GE, 0. 310 0. 004 0. 303 0. 317 
GE; 0. 405 0. 009 0, 388 0. 422 
Aiia 0. 149 0. 001 0. 147 0. 152 
A 0. 294 0. 002 0. 289 0. 299 
Ae 0. 875 0. 024 0. 829 0. 922 
考虑 调查 的 加 权 结 果 

基尼 0. 422 0. 003 0. 417 0. 427 
p10/ p50 0. 287 0. 004 0. 280 0. 294 
p90/ p50 2. 494 0. 023 2. 449 2. 540 
GE- 3. 859 0. 893 2. 090 5. 629 
GE, 0. 346 0. 004 0. 337 0. 354 
GE 0. 308 0. 005 0. 299 0. 317 
GE; 0. 404 0. 010 0. 384 0. 425 
Aap 0. 148 0. 002 0. 145 0. 152 
A 0. 292 0. 003 0. 286 0. 298 
A 0. 885 0. 024 0. 839 0. 932 


资料 来 源 :SIPP。 
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对 不 平等 测量 的 兴趣 并 不 仅 限于 单一 总 体 的 分 析 , 我 们 也 对 总 体 之 间 的 比 
较 感 兴趣 。 在 比较 两 个 总 体 的 过 程 中 ,我 们 经 常 想 对 两 个 总 体 之 间 在 某 一 不 平 
等 测量 上 的 差异 为 0 的 零 假 设 加 以 检验 ,这 是 DASP 能 够 完成 的 一 项 任务 。 现 
在 ,我 们 来 考虑 对 美国 1991 年 和 2001 年 之 间 的 收入 不 平等 进行 比较 的 例子 。 
K 6. 2 给 出 了 1991 年 和 2001 年 家 庭 户 的 收入 及 其 差 值 (2001 年 的 取 值 减 去 
1991 年 的 取 值 ) .与 表 6. 1 中 相同 的 一 套 不 平等 测量 的 点 估计 值 .标准 误 z 比 
fE p 值 和 95% 置 信 区 间 。2001 年 的 收入 不 平等 显著 地 高 于 1991 年 的 证 据 是 
较 强 的 。 尽 管 平均 收入 (以 美元 计算 ) 从 1991 年 的 48065 美元 增加 到 2001 年 的 
51250 美元 ,但 人 口 下 半 部 分 的 收入 却 停滞 不 前 ,正如 p10/p50 分 位 数 比 的 不 显 
著 变化 所 表明 的 。 相 反 , 上 半 部 分 出 现 了 不 相称 的 增长 :比值 p90/p50 从 2. 29 
上 升 到 2. 49, 且 变化 是 显著 的 。 这 一 分 化 导致 所 有 其 他 的 不 平等 测量 在 这 10 
年 间 都 出 现 了 显著 的 增加 。 比 如 ,底部 敏感 的 GE-1 从 1. 3741 增加 到 3. 8592, 
顶部 敏感 的 GEz 从 0. 2677 上 升 到 0. 4041 ,中 部 敏感 的 测量 出 现 了 更 细微 的 增 
长 ,如 基尼 (从 0. 3823 到 0. 4216). 


表 6.2 检验 收入 不 平等 测量 上 的 差异 :SIPP(1991 年 和 2001 年 ) 





测 = 估计 值 标准 误 t p>t 95% 置 信 区 间 
基尼 _91 0. 3823 0. 0023 164.6 0.000 0.3776 0.3869 
基尼 _01 0. 4216 0. 0025 169.6 0.000 0. 4167 0.4265 
差 值 0. 0393 0. 0034 11.6 0.000 0.0326 0.0460 
p10/p50_91 0. 2904 0. 0051 56.4 0.000 0.2801 0, 3007 
p10/p50_01 0. 2865 0. 0035 81.5 0.000 0.2795 0, 2935 
差 值 一 0. 0039 0. 0062 一 0.6 0.533 —0.0162 0.0084 
p90/p50_91 2. 2941 0. 0222 103.3 0. 000 2.2498 2.3383 
p90/p50_01 2. 4943 0. 0228 109.5 0.000 2.4492 2,5395 
差 值 0. 2002 0. 0318 6.3 0.000 0.1375 0. 2630 
GE_,_91 1. 3741 0. 3124 4.4 0.000 0.7513 1.9969 
GE_1_01 3. 8592 0. 8925 4.3 0.000 2.0896 5. 6288 
差 值 2. 4851 0. 9456 2.6 0,010 0.6191 4.3511 
GE,_91 0. 2851 0. 0042 67.7 0.000 0.2767 0.2935 
GE,_01 0. 3457 0. 0043 80.4 0.000 0.3371 0.3542 
差 值 0. 0606 0. 0060 10.1 0.000 0.0487 0.0725 
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续 表 

测 量 估计 值 标准 误 t p>t 95% 置 信 区 间 
GE, _91 0. 2407 0. 0031 78.7 0.000 0.2346 0.2468 
GE,_01 0. 3078 0. 0045 68. 8 0.000 0.2989 0, 3166 
差 值 0. 0671 0. 0054 12.4 0.000 0.0564 0.0778 
GE,_91 0. 2677 0. 0044 61.1 0.000 0.2590 0.2764 
GE,_01 0. 4041 0. 0104 39.0 0.000 0.3835 0.4246 
差 值 0. 1364 0. 0112 12.1 0.000 0.1142 0, 1586 
Ayres O71 0. 1216 0. 0015 81. 6 0.000 0.1186 0.1245 
Array 01 0. 1482 0. 0017 85. 1 0.000 0.1447 0.1516 
差 值 0. 0266 0. 0023 11.6 0.000 0.0221 0.0311 
Aı_91 0. 2480 0. 0032 78.3 0.000 0.2417 0.2544 
Aı_01 0. 2923 0. 0030 96. 0 0.000 0.2862 0, 2983 
差 值 0. 0442 0. 0044 10.1 0.000 0.0355 0.0529 
Az_91 0. 7332 0. 0445 16.5 0.000 0.6445 0.8219 
A2_01 0. 8853 0. 0235 37.7 0.000 0.8387 0.9319 
差 值 0. 1521 0. 0503 3.0 0. 003 0.0528 0.2513 

资料 来 源 :SIPP。 


群体 收入 差异 如 何 影 响 总 的 收入 不 平等 呢 ? 第 4 章 中 讨论 过 的 加 和 分 解 原 
则 表明 RK ALIS EIU. K 6. 3 呈现 了 按 种 族群 体 的 泰 尔 系数 , 即 GE) 
的 分 解 及 其 推断 统计 量 。 另 外 ,我 们 只 使 用 有 关 黑 人 和 白人 的 数据 ,因此 ,总 体 
泰 尔 指数 的 估计 值 与 表 6. 30 中 的 不 同 。 总 泰 尔 为 0. 3052, 组 间 成 分 是 组 间 泰 
尔 0. 0081 ,解释 了 总 量 中 的 2. 7%% ,而 组 内 成 分 为 0. 2971, 解 释 了 总 量 中 的 
97. 3%。 组 内 成 分 为 组 泰 尔 的 加 权 和 ,权重 是 总 份额 与 组 均值 对 总 均值 之 比 的 
乘积 。 就 白人 来 看 ,此 加 权 的 组 泰 尔 的 贡献 为 0. 2669( 总 量 的 87. 5%) ;就 黑人 
来 看 , 则 为 0.03%( 总 量 的 9. 9%) 。 该 表 以 绝对 值 和 相对 值 两 种 形式 提供 了 总 
的 和 分 组 别 的 泰 尔 指数 ,总 份额 .组 均值 对 总 均值 之 比 以 及 加 权 分 组 别 的 贡献 
的 标准 误 。 所 有 这 些 统计 量 都 显著 地 区 别 于 0。 泰 尔 指数 , 即 参数 0 为 1 时 的 





O 原文 此 处 误 为 “ 表 6. 2”。 一 一 译 者 注 
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SORE JF PUR. BA 0 的 上 升 ,白人 的 贡献 也 在 增加 ,而 黑 
人 的 贡献 则 在 下 降 。 就 GE: 而 言 ,白人 的 相对 贡献 变 成 了 91. 7% ,而 黑人 的 则 
为 6. 4%。 反 方向 而 言 ,对 于 GE ,白人 的 贡献 更 低 , 处 在 71.7% ,而 黑人 的 则 更 
高 ,处 在 28%。 


ROI 按 种 族 的 收入 泰 尔 指数 分 解 :SIPP(2001 年 ) 





组 群 测量 总 份额 (mu_k/mu) 绝对 贡献 相对 贡献 
L AA 0. 2949 0. 8633 1. 0483 0. 2669 0. 8746 
0. 0047 0. 0025 0. 0021 0. 0044 0. 0038 
2. BA 0. 3175 0. 1367 0. 6950 0. 0302 0. 0988 
0. 0094 0. 0025 0.0121 0. 0013 0. 0046 
组 内 = = = 0. 2971 0. 9734 
组 间 = 一 0. 0081 0. 0266 

一 一 一 0. 0001 一 
总 和 0. 3052 1. 0000 — 0. 3052 1. 0000 
0. 0045 0. 0000 = 0. 0045 0. 0000 
资料 来 源 :SIPP。 


收入 代表 着 家 庭 户 的 资源 流动 ,而 财富 则 反映 了 存量 。 美 国 的 财富 不 平 
等 在 同一 时 期 是 如 何 演变 的 呢 ? 我 们 使 用 SIPP 财富 数据 来 考察 允许 资产 净 
值 为 负 值 的 不 平等 测量 在 1991 年 与 2001 年 之 间 的 差异 。 基 尼 系 数 、 基 于 分 
位 数 的 测量 和 GE2 (变异 系数 平方 的 一 半 ) 都 能 够 处 理 负 资 产 净值 和 零 资 产 净 
值 ,结果 呈现 在 表 6.4 中 。 首 先 ,我 们 注意 到 ,资产 净值 的 基尼 系数 远 远 大 于 
收入 的 基尼 系数 。 此 外 ,基尼 从 1991 年 的 0.6944 到 2001 年 的 0.7635, 增 加 
了 0.069。 这 一 增 量 是 显著 的 。 比 值 p25/p75 显著 地 下 降 ,这 表明 中 间 50% 
的 人 口 在 财富 上 的 分 化 。 同 样 ,比值 p50/p90 也 下 降 ,意味 着 典型 的 美国 家 
庭 户 当时 比 最 富足 的 5% 更 穷 。 我 们 也 来 看 看 下 半 部 分 的 份额 与 最 高 5% 的 
份额 的 份额 比 。 此 份额 比 表 明 , 家庭 户 财富 相对 于 最 高 5% ,增长 得 有 多 快 。 
最 后 ,通常 与 方差 和 变异 系数 等 价 的 GE2 大 大 增加 , 它 反 映 了 顶部 末尾 的 
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表 6.4 检验 财富 不 平等 测量 估计 值 的 差异 :SIPP(1991 年 和 2001 年 ) 








测 量 估计 值 标准 误 t p>t 95% 置 信 区 间 
基尼 _91 0.6944 0.0035 197.5640 0.0000 0.6874 0.7014 
基尼 _01 0.7635 0.0142 53. 8138 0. 0000 0.7354 0.7916 
差 值 0.0691 0, 0146 4.7260 0.0000 0.0402 0.0979 
p25/p75_91 0.0378 0.0025 15.0647 0. 0000 0.0328 0.0428 
p25/p75_01 0.0216 0.0017 12.9010 0. 0000 0.0183 0.0250 
差 值 一 0.0162 0.0030 —5.3537 0.0000 —0.0221 —0. 0102 
p50/ p90_91 0.1014 0. 0023 44.0190 0. 0000 0.0968 0.1060 
p50/p90_01 0.0840 0.0017 49.6032 0. 0000 0.0807 0.0874 
差 值 一 0.0174 0.0029 —6.0757 0.0000 —0,0230 —0. 0117 
sb50/st5_91 0.1244 0.0052 23.7494 0. 0000 0.1140 0. 1349 
sb50/st5_01 0.0449 0.0120 3.7496 0. 0003 0.0212 0. 0687 
差 值 一 0.0795 0.0131 —6.0798 0.0000  —0,1053 —0. 0537 
GE,_91 1.4758 0.0635 23. 2430 0. 0000 1. 3492 1. 6023 
GE,_01 40.9671 30.0551 1.3631 0.1758 —18.6265 100. 5608 
差 值 39. 4914 30.0551 1.3140 0.1917 —19.8211 98.8039 


资料 来 源 :SIPP。 


表 6.5 按 种 族群 体 的 财富 不 平等 测量 分 解 :SIPP(2001 年 ) 





组 群 GE, 总 份额 均值 比 平方 绝对 贡献 相对 贡献 
k AA 37. 3750 0. 8629 1, 2553 40. 4847 0. 9982 
27.1211 0. 0025 0. 0064 29. 5457 0. 0013 
2. BA 3. 3032 0. 1371 0. 0586 0. 0266 0. 0007 
0. 4014 0. 0025 0. 0067 0. 0059 0. 0006 
组 内 一 一 :一 40. 5113 0. 9989 
组 间 == = = 0. 0456 0. 0011 

-一 一 一 0. 0009 一 
总 和 40. 5569 1. 0000 一 : 40. 5569 1. 0000 
29. 5442 0. 0000 一 29. 5442 0. 0000 
资料 来 源 :SIPP。 


我 们 以 GE: 为 例 , 进 一 步 考 察 种 族群 体 如 何 影 响 总 财富 不 平等 ( 见 表 6. 5) 。 
与 针对 家 庭 户 收入 的 分 解 类 似 ,我 们 只 看 黑人 和 白人 的 子 群体 。GE2 组 内 成 分 
的 权重 不 同 于 GE1( 泰 尔 指数 ) ,因为 我 们 使 资产 净值 的 组 均值 对 总 均值 之 比 平 
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方 。 表 6. 5 显示 ,白人 资产 净值 的 GE2z 远 远 大 于 黑人 的 情况 。 总 GE: PRA 
0.1% 受 到 了 组 间 成 分 的 影响 ,而 其 余 99. 9% 源 于 组 内 成 分 ,其 中 ,白人 种 族群 
体 的 多 样 性 贡献 了 总 GE2 的 99. 8%, 而 黑人 种 族群 体 的 多 样 性 实际 上 对 总 
GE: 并 无 贡献 ,因为 0.07% 并 不 显著 地 区 别 于 0。 

使 用 表 6. 1 到 表 6. 5, 我 们 已 经 示例 性 地 说 明了 意识 到 样本 并 非 总 体 及 恰 
当地 考虑 复杂 调查 设计 的 重要 性 。 调 整 调查 设计 的 渐 近 方法 得 到 恰当 的 推断 
统计 量 。DASP 程序 使 对 各 种 不 平等 测量 调整 调查 设计 的 渐 近 方法 变 得 更 便 
利 。 对 于 小 样本 和 基于 相对 分 布 的 不 平等 测量 , 自 举 法 会 更 恰当 。 下 一 节 我 们 
将 介绍 这 一 方法 。 并 无 此 需要 的 读者 可 以 跳 到 下 一 章 。 


自 举 方法 


自从 艾 福 荣 及 蒂 鲍 希拉 尼 推 广 自 举 方法 以 来 (Efron，1979; Efron & Tib- 
shirani，1993), 它 已 被 应 用 到 诸多 统计 推断 间 题 上 。ASE 建立 在 解析 的 线性 渐 
近 通 近 基础 上 ,而 BSE 则 建立 在 强力 计算 重复 抽样 思路 的 基础 之 上 。 下 面 ,我 
们 先 简单 地 介绍 标准 的 自 举 法 (更 详细 的 内 容 见 Mooney & Duval, 2003). F 
们 还 将 简单 讨论 考虑 了 调查 设计 的 自 举 法 (Duclos & Araar, 2006)。 


自 举 法 基本 原理 


以 一 个 随机 数 种 子 开始 ,我 们 从 规模 为 n 的 实际 数据 样本 中 ,以 回 置 方式 
重复 抽取 规模 为 n( 或 者 n 足够 大 时 ,一 个 小 于 的 规模 ) 的 BB 个 (比如 ,500 至 
2000) 随 机 样本 。 每 一 个 自 举 法 样本 都 略微 不 同 于 实际 样本 ,同时 ,各 自 之 间 也 
都 略 有 不 同 ,原因 在 于 采用 了 回 置 抽样 一 一 某 些 观 测 案例 将 在 自 举 法 样本 中 
出 现 多 次 ,而 其 他 的 将 被 忽略 掉 。 此 外 ,重要 的 是 要 注意 , 当 执 行 重复 抽样 时 ， 





中 ”也 译 为 " 重 置 抽样 >"“ 重 复 抽样 ?或 “有 放 回 的 抽样 ?等 ,是 指 从 总 体 单位 中 抽取 一 个 单位 后 ， 
将 其 放 回 总 体 中 ,然后 再 抽取 下 一 个 单位 ,这 种 连续 抽取 样本 的 方法 就 被 称 做 “ 回 置 抽样 "。 由 此 可 
见 , 回 置 抽样 时 ,总 体 单位 数 在 抽 选 过 程 中 始终 未 减少 ,总 体 而 言 , 各 单位 被 抽 中 的 可 能 性 前 后 相同 ， 
而 且 各 单位 有 被 重复 抽 中 的 可 能 。 一 一 译 者 注 
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样本 是 独立 获取 的 。 所 得 的 500 到 2000 个 估计 的 不 平等 测量 (比如 ,基尼 ) 构 成 
了 一 个 分 布 , 该 分 布 近似 于 基尼 估计 量 的 抽样 分 布 。 如 果 想 复制 整个 过 程 , 相 
同 的 随机 数 种 子 必须 被 用 来 取得 完全 相同 的 抽样 分 布 。 自 举 法 包含 两 个 步 又 
的 BB 次 操作 : 

首先 ,以 回 置 抽样 方式 从 规模 为 n 的 样本 中 抽取 一 个 规模 为 n 的 自 举 法 样 
本 。 其 次 ,使 用 这 第 一 个 自 举 法 样本 计算 所 关注 的 不 平等 测量 ,得 到 B 自 举 法 
估计 值 ,这 些 将 被 用 来 计算 自 举 法 推断 统计 量 。 

为 了 取得 BSE, 我 们 只 需要 计算 自 举 法 样本 的 标准 差 。 我 们 经 常 使 用 B= 
500 来 生成 BSE, 用 1. 96BSE 可 以 计算 围绕 自 举 法 均值 的 95% 置 信 区 间 。 

接 下 来 ,我 们 放松 估计 值 抽 样 分 布 的 正 态 性 假定 。 方 法 之 一 被 称 做 “ 百 分 
位 数 法 ”。 如 果 我 们 有 999 次 试验 ,并 将 估计 的 不 平等 测量 (比如 ,基尼 系数 ) 
从 低 到 高 加 以 排序 ,那么 ,95%% 置 信 区 间 就 以 第 25 个 和 第 975 个 基尼 系数 为 
界 。 因 为 999 个 估计 的 基尼 系数 值 都 没有 出 界 , 因 此 ,95% 置 信 区 间 也 不 会 出 
界 。 我 们 用 一 个 更 大 数量 的 重复 样本 (比如 ,1000 至 2000) 来 产生 基于 百 分 
位 数 的 置信 区 间 。 与 蔡 代 方法 相 比 ,基于 百 分 位 数 的 置信 区 间 表 现 优异 
(Burr，1994) 。 

若干 程序 已 被 发 展 出 来 用 于 处 理 估 计 值 的 自 举 法 分 布 也 许 有 偏 的 可 能 性 ， 
包括 偏 误 修正 百 分 位 数 法 以 及 偏 误 修正 和 加 速 法 (Efron & Tibshirani, 1993; 
Mooney & Duval,，1993)。 这 里 ,我 们 对 只 涉及 偏 误 修正 因子 的 偏 误 修正 百 分 
位 数 法 进行 说 明 。 此 方法 针对 中 位 数 上 的 偏 误 来 调整 区 间 的 上 下 限 (Efron & 
Tibshirani, 1986), 

首先 ,计算 偏 误 修 正 因子 是 与 比 用 实际 数据 得 到 的 估计 值 更 小 的 自 举 法 估 
计 值 的 比例 相对 应 的 标准 正 态 分 数 。 令 了 为 以 实际 数据 得 到 的 不 平等 测量 ， 
Î * 为 以 自 举 法 样本 得 到 的 不 平等 测量 ,而 zo 为 偏 误 修正 因子 。 我 们 定义 zo = 
@-1I[PrC7* < Î)], 其 中 , 盏 是 标准 正 态 累积 分 布 函数 ,@-1 是 其 逆 函 数 ,也 就 
是 分 位 数 ( 百 分 位 数 ) 函数 。 比 如 ,小 于 实际 估计 值 的 自 举 法 估计 值 的 比例 为 
0. 55, 那 么 ,对 应 的 标准 正 态 分 数 zo = 0. 125。 

其 次 ,以 这 一 偏 误 修正 因子 对 被 用 来 计算 想 要 的 置信 区 间 界 限 的 百 分 位 数 
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进行 修正 : Cl = [G7 (@( 29/2 + 220)), G! (lzi + 220)) J, HFG"! 
(。) 为 估计 的 不 平等 测量 的 分 位 数 函数 。 我 们 基本 上 使 用 不 同 的 百 分 位 数 来 
调整 中 位 数 偏 误 。 比 如 ,对 于 95% 置 信 区 间 , zs/2 =— 1. 96 H zi-a/2 = 1. 96. ŒE 
中 位 数 偏 误 的 例子 中 ,我 们 并 未 使 用 1000 次 重复 中 的 第 25 个 和 第 975 个 自 举 
法 估计 值 。 我 们 通过 加 上 偏 误 修正 因子 的 2 倍 ,2zo = 2X0.125 = 0. 25, X} z 
分 进行 修正 。 因 此 ,对 于 下 限 , 偏 误 修正 的 z 分 变 成 了 一 1.96 十 0. 25 =—1.17, 
而 对 于 上 限 , 则 为 1. 96 十 0. 25 = 2. 21。 对 应 的 累积 密度 为 0. 044 和 0. 986, 
此 , 偏 误 修正 百 分 位 数 法 得 到 了 以 第 44 个 自 举 法 估计 值 为 下 限 和 第 986 个 自 举 
法 估计 值 为 上 限 的 95% 置 信 区 间 。 

此 偏 误 修 正方 法 假定 自 举 法 估计 的 标准 误 对 所 有 的 估计 值 都 是 不 变 的 。 当 
这 一 假定 不 成 立时 ,就 需要 做 进一步 的 调整 。 有 兴趣 的 读者 可 参看 艾 福 荣 和 蒂 鲍 
希拉 尼 有 关 加 速 方法 和 偏 误 修正 方法 的 内 容 (Efron & Tibshirani，1993:186) 。 

研究 者 可 以 使 用 乔 利夫 等 人 编写 的 Stata 程序 “ineqerr” 来 获得 所 选取 不 平 
等 测量 的 自 举 法 推断 统计 量 。(Jolliffe & Krushelnytsky, 1999) “ineqerr” 会 给 
出 基尼 系数 、 泰 尔 指 数 和 对 数 方差 的 基于 正 态 性 的 、 基 于 百 分 位 数 的 和 偏 误 修 
正 的 自 举 法 置信 区 间 。 

使 用 类 似 的 程序 , 自 举 方法 也 可 被 用 来 检验 两 个 总 体 之 间 在 一 个 不 平等 测 
量 上 的 差异 是 否 显 著 地 不 同 于 0。 根 据 从 两 个 实际 样本 中 再 抽取 的 样本 ,我 们 
估计 了 这 两 个 样本 之 间 在 一 个 不 平等 上 的 差异 。 这 些 得 到 的 差异 估计 与 此 差 
异 抽样 分 布 近似 。 参 见 杜 克 罗 斯 和 阿拉 尔 (Duclos & Araar, 2006). 


相对 分 布 测量 的 自 举 法 推断 


相对 分 布 方法 用 于 考察 比 对 分 布 对 参照 分 布 所 得 到 的 整个 相对 分 布 ,概要 
测量 可 根据 此 相对 分 布 得 到 。 因 为 这 些 概要 测量 估计 量 的 渐 近 性 质 是 未 知 的 ， 
所 以 我 们 利用 自 举 法 标准 误 和 自 举 法 置信 区 间 的 稳健 性 。 

这 一 程序 可 描述 为 4 个 步骤 : 

第 一 ,以 回 置 抽 样 方式 ,从 参照 组 样本 中 抽取 一 个 自 举 法 样本 ,同时 也 从 比 
较 组 样本 中 抽取 一 个 自 举 法 样本 。 
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第 二 ,根据 这 两 个 第 一 轮 的 自 举 法 样本 ,我 们 创建 了 自 举 法 相对 数据 ,根据 
这 一 数据 ,我 们 得 到 第 一 轮 的 概要 测量 。 

第 三 ,将 步骤 1 和 2 重复 1000 次 。 

第 四 ,所 得 到 的 概要 测量 的 自 举 法 分 布 的 中 部 95% 界 定 了 这 些 概要 测量 的 
95% 置 信 区 间 。 前 面 讨论 过 的 偏 误 修正 方法 可 被 应 用 于 自 举 法 置信 区 间 。 

在 将 黑人 收入 分 布 (比较 组 ) 与 白人 收入 分 布 (参照 ) 进 行 比较 的 过 程 中 ,我 
们 用 来 自 1000 个 自 举 法 样本 的 相对 箭 估计 值 来 获得 推断 统计 量 ( 见 表 6. 6)。 
WEI SAAR HA 0. 1375。 基 于 百 分 位 数 的 95% 置 信 区 间 为 [0. 1204, 0. 1576], 而 
偏差 修正 的 区 间 为 L0. 1187, 0. 1546]。 这 些 结果 反映 了 黑人 收入 分 布 和 白人 收 
人 分 布 之 间 的 一 个 显著 分 化 。 具 体 而 言 , 偏 误 修 正 的 置信 区 间 显 示 , 相 对 炉 的 
下 限 为 0. 1187, 上 限 为 0. 1546。 基 于 实际 数据 的 中 位 数 相 对 极 化 (MRP) 被 估 
计 为 一 0. 2248, 其 95% 置 信 区 间 为 [一 0. 2467, 一 0. 2028j], 偏 误 修正 的 区 间 为 
[一 0. 2475, 一 0. 2033]。 这 两 种 置信 区 间 也 由 下 部 相对 极 化 (LRP) 和 上 部 相对 
极 化 (URP) 提 供 。 这 表明 ,黑人 收入 比 白人 收入 更 不 极 化 ,而 且 LRP 对 MRP 
的 解释 量 是 URP WIO, AX LRP 的 上 限 (根据 偏 误 修 正 的 CI, 为 一 0. 2717) 
远 低 于 URP 的 下 限 (一 0. 1686), 


表 6.6 黑人 收入 和 白人 收入 之 间 相 对 炉 和 相对 极 化 的 自 举 法 推断 :SIPP(2001 年 ) 














自 举 法 样本 
测量 | 实际 的 样本 估计 值 ”基于 百 分 位 数 的 CI 偏 误 修正 的 CI 
第 25 个 ”第 975 个 ”第 25 个 第 975 个 
RE 0. 1375 0. 1204 0. 1576 0. 1187 0. 1546 
MRP 一 0. 2248 一 0.2467 —0. 2028 —0.2475  —0.2033 
LRP 一 0. 3095 一 0.3497 ”一 0.2745 —0.3462 —0. 2717 
URP 一 0. 1401 一 0.1656 —0.1104 —0.1686 —0.1130 


注 :LRP: 下 部 相对 极 化 ;MRP: 中 位 数 相对 极 化 ;RE: AAR; URP: EARTH. AER HET ET 
1000 个 自 举 法 样本 。MRP = 0.5 X LRP +0. 5 X URP, 
资料 来 源 :SIPP。 


中 ”原文 此 处 有 错 , 变 成 了 LRP LRP 自己 的 比较 ,这 里 将 后 一 个 LRP 改正 为 URP。 一 一 译 者 注 
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含 调查 抽样 设计 的 自 举 法 


当 自 举 法 抽样 被 用 到 复杂 调查 设计 的 情形 中 时 ,我 们 需要 考虑 该 设计 ,以 
得 到 估计 值 的 恰当 标准 误 。 复杂 调 查 设计 经 常 包含 集群 和 根据 一 些 特征 所 形 
成 的 层 。 与 简单 随机 抽样 相 比 , 聚 群 会 增加 标准 误 , 而 分 层 则 会 减少 标准 误 。 
复杂 调查 设计 往往 导致 最 终 抽样 单位 具有 不 同 的 抽样 权重 。 抽 样 权重 被 用 来 
估计 加 权 统计 量 , 但 它 对 调整 这 些 加 权 统 计量 的 标准 误 并 无 帮助 。 

当 使 用 调查 数据 时 ,我们 应 当 对 调查 抽样 设计 保持 警觉 ,并 设法 得 到 与 调 
查 设 计 有 关 的 3 个 基本 变量 一 一 初级 抽样 单位 、 层 和 抽样 权重 。 因 为 PSU 和 层 
都 是 涉及 地 理 编码 的 ,因此 ,调查 组 织 方 为 保护 隐私 的 惯常 做 法 是 不 提供 实际 
的 PSU 和 层 。 一 些 调查 会 提供 与 原始 设计 近似 的 准 PSU 和 层 ,SIPP 数据 就 属 
于 这 种 情形 。 根 据 调 查 的 自 举 涉及 从 每 一 层 抽 取 自 举 法 样本 的 行为 (Biewen， 
2002; Biewen & Jenkins, 2006; Duclos & Araar, 2006), Stata 中 的 
“bsample” 命 令 通过 设 定 层 和 PSU 的 选项 , 允许 对 调查 设计 加 以 考虑 。 一 个 由 
杜 克 罗 斯 和 阿拉 尔 编写 的 ,用 于 进行 分 布 分 析 的 独立 软件 包 DAD, 专 门 对 一 套 
不 平等 测量 以 复杂 调查 数据 来 执行 自 举 法 。 本 ， 詹 恩 编写 的 Stata 程序 “reld- 
ist” 对 相对 极 化 及 其 分 解 的 估计 来 自 复杂 调查 数据 的 自 举 法 标准 误 (Jann， 
2006) 。 我 们 将 在 最 后 一 章 的 真实 例子 中 展示 这 些 工具 的 使 用 方法 。 


渐 近 方法 和 自 举 方法 的 表现 


正如 上 面 提 到 的 , 杜 克 罗斯 和 阿拉 尔 建 议 , 当 样本 规模 较 大 且 概 要 不 平等 
测量 佑 计量 的 抽样 分 布 趋 于 正 态 时 ,我 们 可 以 放心 地 使 用 渐 近 方法 (Duclos & 
Araar,，2006) 。 含 混 不 清 的 问题 是 ,多 大 的 样本 规模 才 足 够 大 ? 另 一 个 很 不 清 
楚 的 问题 在 于 ,不 平等 测量 的 不 同类 型 之 间 的 抽样 变异 ,以 及 不 平等 测量 对 其 
敏感 的 分 布 的 不 同 区 域 之 间 的 抽样 变异 是 否 存在 差异 ? 为 了 给 出 这 些 问题 的 
答案 ,我 们 进行 蒙特 卡 洛 实验 ,大 致 将 SIPP 2001 年 的 收入 数据 集 视 为 一 个 全 部 
人 口 ,我 们 可 以 对 它 计算 出 5 个 不 平等 测量 的 “真实 ” 值 :基尼 系数 (中 部 敏感 
的 ) 、 阿 特 金森 指数 Al/z (中 部 敏感 的 )、 泰 尔 指 数 (中 部 敏感 的 ) .GE-1( 底 部 敏 
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感 的 ) 和 GE2 (顶部 敏感 的 ) 。 我 们 利用 抽样 过 程 的 蒙特 卡 洛 模拟 来 确定 这 两 个 
置信 区 间 技 术 的 表现 。 我 们 重复 地 从 总 体 中 抽取 样本 ,并 将 它们 视 为 在 收集 样 
本 数据 时 得 到 的 样本 ,同时 ,对 真实 的 不 平等 测量 构建 一 个 置信 区 间 。 通 过 重 
复 这 一 过 程 ,我 们 能 够 凭借 正确 实现 以 95% 概 率 包含 真 值 (包含 概率 ) 的 能 力 及 
其 长 度 和 形状 ,来 确定 置信 区 间 技 术 的 表现 。 

为 了 比较 渐 近 方法 和 自 举 方法 ,我 们 考虑 下 面 两 种 情形 :小 样本 规模 (100) 
和 大 样本 规模 (1000) 。 实 验 目的 是 用 3 个 标准 来 评估 95% 置 信 区 间 的 表现 : 
(1)95CI 包含 真 值 的 概率 (95% 被 认为 是 一 个 好 表现 );(2)95CI 的 平均 长 度 ; 
(3) 以 上 界 对 下 界 的 比值 (被 期 望 接近 于 1) 来 描述 的 CI 的 形状 。 

对 于 渐 近 方法 ,我 们 以 无 回 置 方式 抽取 任 一 规模 的 一 个 样本 ,用 杜 克 罗 斯 
和 阿拉 尔 的 DASP 程序 得 到 95% 置 信 区 间 , 并 重复 这 一 步骤 1000 次 。 基 于 这 
1000 个 置信 区 间 ,我 们 得 到 上 述 3 个 标准 的 概要 值 。 对 于 自 举 方法 ,我 们 以 回 
置 方式 抽取 任 一 规模 (100 或 1000) 的 一 个 样本 ,并 重复 使 用 自 举 抽样 百 分 位 数 
法 和 自 举 抽样 偏 误 修正 和 加 速 (BCa) 法 1000 次 。 为 了 确保 一 个 公正 的 比较 ,我 
们 对 3 种 方法 都 使 用 相同 的 自 举 法 抽取 。 抽取 样本 和 建构 置信 区 间 这 一 步 再 次 
被 重复 1000 次 ,然后 ,我 们 得 到 3 个 标准 的 概要 值 。 

比较 这 两 种 方法 之 间 和 各 不 平等 测量 之 间 的 这 些 标准 有 以 下 建议 :第 一 ， 
如 果 样 本 规模 为 1000 或 更 大 ,那么 , 渐 近 方法 可 被 放心 使 用 ,因为 渐 近 方法 和 自 
举 方法 的 表现 几乎 完全 一 样 , 而 自 举 方法 需要 密集 的 计算 时 间 。 第 二 , 当 样 本 
规模 比较 小 的 时 候 ,比如 100, 渐 近 方 法 和 自 举 方法 呈现 出 较 差 的 表现 。BCa 方 
法 只 是 略微 对 百 分 位 数 方法 有 所 改进 。 因 此 ,我 们 并 不 推荐 将 BCa 方法 作为 常 
规 做 法 。 此 外 ,并 不 存在 与 自 举 方法 相 联系 的 很 大 收益 。 在 两 种 方法 中 , 建立 
在 估计 量 标准 误 的 估计 值 基础 上 的 置信 区 间 比 其 应 当 呈 现 的 情况 更 窄 ,这 意味 
着 ,标准 误 估 计 值 是 向 下 有 偏 的 。 比 如 ,在 小 样本 情况 下 ,基尼 系数 的 95CI 包含 
概率 约 为 90%。 第 三 ,不 同类 型 的 不 平等 测量 之 间 的 抽样 变异 存在 巨大 的 差 
Ss ENE FA CE AR CE A A T Bd AR ae BRS AT SH Se AS TAD 。 
抽样 变异 也 会 随 着 不 平等 测量 在 其 上 敏感 的 分 布 的 区 域 而 变动 :中 部 敏感 的 为 
最 低 , 顶部 敏感 的 为 次 低 , 而 底部 敏感 的 则 很 高 。 具 体 而 言 , 即 使 对 于 大 样本 
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(1000) ,包含 GE—1 真 值 的 CI 的 百分比 约 为 60% ’ mA. 当 样 本 规模 为 100 时 ， 
一 包含 概率 很 差 ( 二 20%)。 因 此 ,在 对 底部 敏感 的 不 平等 测量 的 推断 进行 解 
释 时 ,我 们 必须 小 心 谨慎 。L14] 


小 结 


本 章 对 不 平等 测量 的 推断 进行 了 讨论 。 我 们 使 用 包含 了 复杂 调查 设计 的 
DASP 程序 ,示例 性 地 说 明了 渐 近 标准 误 、 置 信 区 间 和 一 套 不 平等 测量 的 假设 检 
验 的 计算 。 我 们 也 对 以 标准 自 举 方法 对 基于 相对 分 布 的 不 平等 测量 进行 推断 
做 了 说 明 。 此 外 ,我 们 也 介绍 了 针对 复杂 调查 数据 的 自 举 方法 。 我 们 突出 了 对 
不 平等 测量 进行 推断 的 重要 性 ,因此 能 够 以 一 定 的 把 握 度 将 其 一 般 化 到 总 
体 中 。 

到 现在 为 止 ,我 们 的 关注 点 一 直 是 整个 人 口 或 两 个 人 口 之 间 的 不 平等 。 不 
平等 的 来 源 经 常 不 仅仅 包括 一 个 分 组 变量 。 两 个 群体 之 间 不 平等 的 模式 会 将 
分 组 变量 的 效应 与 其 他 因素 的 效应 混淆 起来。 为 了 可 信 地 描述 在 控制 其 他 因 
素 的 情况 下 两 个 群体 之 间 的 差异 ,我 们 转向 基于 模型 的 方法 ,这 是 下 一 章 的 
主题 。 
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不 平等 研究 关注 一 个 总 体 的 属性 的 不 均匀 分 布 ,比如 收入 。 这 一 属性 与 某 
些 总 体 特征 有 关 , 比 如 ,种 族 . 教 育 和 年 龄 。 两 个 时 期 之 间 ,影响 该 属性 边际 分 
布 的 总 体 特征 的 构成 和 给 定 这 些 特征 情况 下 该 属性 的 条 件 分 布 可 能 有 变化 。 
因此 ,特征 构成 的 变化 和 控制 特征 不 变 的 情况 下 ,属性 分 布 的 变化 都 会 影响 不 
平等 测量 的 趋势 。 这 里 ,我 们 介绍 一 种 方法 , 它 将 不 平等 测量 的 变化 分 解 为 构 
成 成 分 和 条 件 成 分 (Machado & Mata，2005)。 请 参见 迪 那 多 等 人 以 及 詹金斯 
和 凡 。 克 尔 曼 著作 中 关于 密度 分 解 的 相关 主题 (DiNardo et al. ，1996; Jenkins 
& Van Kerm, 2005). 

请 考虑 一 个 简单 的 情形 , 即 属性 是 收入 ,特征 是 种 族 , 其 中 ,黑人 是 少数 而 
白人 是 多 数 。 收 入 不 平等 随时 间 推 移 而 出 现 的 整体 变化 源 于 两 个 不 同 的 成 
分 一 一 种 族 构成 上 的 变化 和 给 定 种 族 情况 下 ,收入 的 条 件 分 布 上 的 变化 。 这 两 
个 成 分 上 变化 的 结合 可 以 在 3 个 不 同 的 方面 ,对 变化 中 的 不 平等 产生 影响 :第 
一 ,黑人 一 白人 收入 差距 的 增 大 且 更 大 的 黑人 比例 毫 无 疑问 将 会 增加 不 平等 ; 
第 二 ,黑人 一 白人 收入 差距 的 减 小 且 更 小 的 黑人 比例 毫 无 疑问 将 会 减少 不 平 
等 ;第 三 ,黑人 一 白人 收入 差距 的 增 大 ( 减 小 ) 且 更 小 (更 大 ) 的 黑人 比例 将 导致 
不 平等 出 现 一 个 整体 变化 。 因 此 ,重要 的 是 区 分 每 一 个 来 源 的 贡献 。 为 此 ,我 
们 使 用 一 种 反 事实 分 解 方法 进行 分 析 (Machado & Mata, 2005), 

反 事 实 方法 的 关键 要 素 是 ,创建 一 个 真实 世界 中 并 不 存在 的 反 事实 分 布 : 
在 给 定 另 一 时 期 的 协 变量 的 情况 下 ,一 个 时 期 的 条 件 反应 分 布 。 在 介绍 此 方法 
之 前 ,我 们 将 条 件 分 布 定义 为 给 定 协 变量 情况 下 ,反应 变量 的 分 布 ,将 联合 分 布 
定义 为 反应 变量 和 协 变量 共同 的 分 布 ,而 将 边缘 分 布 定 义 为 不 考虑 协 变量 情况 
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下 的 非 条 件 分 布 。 边 缘分 布 可 以 通过 对 协 变量 所 有 取 值 上 的 联合 概率 质量 ( 密 
度 ) 函 数 求 和 (更 一 般 而 言 , 求 积分 ) 得 到 。 这 一 根据 联合 分 布 得 到 边缘 分 布 的 
S y 为 家 庭 户 收 入 ( 略 去 了 家 庭 户 的 下 标 ) ,并 令 r 为 一 个 协 变量 , 它 可 以 
是 连续 的 (比如 ,能 力 ) 或 离散 的 (比如 ,种 族 )。 我 们 用 C 来 表示 上 AY x 的 构成 ， 
用 F; C, ) 来 表示 ye 的 边缘 分 布 。 请 注意 ,这 是 个 实际 分 布 而 不 是 反 事实 的 。 
当 我 们 考虑 不 同时 间 * 时 的 协 变量 的 构成 并 使 用 上 时 y 的 条 件 分 布 时 ,我 们 就 
得 到 了 一 个 反 事实 的 边缘 分 布 , 将 其 记 为 POs C;)。 概 要 不 平等 测量 TT 上 从 
时 间 1 到 时 间 2 的 变化 由 AT = h = ILF(y23 C2)] 一 ILF(y1; C1)] 0 给 
出 。 通 过 引入 一 个 反 事 实 边缘 分 布 , 我 们 从 代数 上 可 以 将 这 一 变化 表达 如 下 : 


Al = (IL F(y23 C2) ]—ILFGy2; C1)]}+ {ILF(y2; C1) — ILFG; Ci) J} 
C7. 1] 


其 中 ,第 一 项 ILFCy2s C2)]— ILF; CI) 反映 了 在 固定 条 件 分 布 的 情 
况 下 , 协 变量 构成 变化 的 贡献 ; IL Cy2 3 C1) J — IL FCs Ci) ] 反映 了 在 给 定 协 
变量 , 即 固定 构成 的 情况 下 ,条 件 反 应 分 布 上 变化 的 贡献 。 

在 方程 7. 1 中 , 反 事 实 不 平等 固定 了 时 间 1 处 的 协 变量 构成 和 时 间 2 处 的 
条 件 反应 分 布 F(yz; Cl ) 。 一 个 相反 的 顺序 是 ,固定 了 时 间 2 处 的 协 变量 构成 
和 时 间 1 处 的 条 件 反应 分 布 F(y; Cz)。 分 解 方程 变 成 AT== (ILF; C2)] 一 
ILF(y13 C1)]) 十 {ILFCyz; Cz)] 一 ILF(y1; Cz)])。 两 种 顺序 之 间 的 结构 也 许 
不 同 。 我 们 可 以 取 它 们 的 平均 值 作为 最 终 的 分 解 。 

反 事实 分 布 在 xz 为 取 值 为 0 或 1 的 二 分 变量 的 特殊 情况 下 很 容易 理解 。 在 
这 一 情形 中 ,在任 一 给 定 的 时 期 上 中 ,属性 y 只 有 两 个 条 件 分 布 需要 考虑 , 即 
x= 0 if y 的 条 件 分 布 和 x 二 1 时 y 的 条 件 分 布 。 我们 用 f.(y10) 和 f(y11) 来 
表示 t+ 时 x = 0 或 x = 1 的 情况 下 ,yy 条件 概率 密度 函数 或 概率 质量 函数 
(PMF), H e OF ce 1) 分 别 表 示 工 二 0 和 工 二 1 时 的 人 口 比 例 。 那 么 ,> 在 : 





OQ 原文 此 处 多 了 两 个 左 括号 ,已 删除 。 一 一 译 者 注 
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时 的 边缘 概率 密度 函数 ( 非 反 事实 的 ) 为 : 

fily | 0)c(0) 十 fi(y | 1)c (1) 
它 上 具有 两 个 条 件 分 布 的 加 权 平 均值 的 形式 。 然 而 , 当 我 们 基于 不 同时 间 s 处 的 
( 协 变量 ) 构 成 来 构建 上 时 的 反 事 实 分 布 时 ,我 们 使 用 相同 的 条 件 分 布 和 一 个 不 
同时 间 上 的 比例 ,分 别 以 (0) 和 cs*(G1) 替 换 人 口 比例 (0) 和 c (1) ,得 到 : 

fily | Des) + fry | Des) 

为 了 用 统计 软件 进行 计算 ,将 基于 此 反 事 实 分 布 的 不 平等 测量 的 计算 当做 

通过 使 用 包含 反 事实 抽样 权重 的 不 平等 测量 而 得 到 的 是 有 帮助 的 。 定 义 两 个 


”权重 w(0) = cs《0)/c(0) 和 w(1) = cs(1)/c(1)， 我 们 可 以 重新 将 1 时 的 反 事 


实 表达 为 : 


cs (0) 
Ct (0) 








aa 


fily | Wao) ( er 


JHO IDa] 
= fi(y | 0)c C0)w 0) + fr Cy | Daw) 


它 基 本 上 是 1 时 的 一 个 加 权 边 缘分 布 。 比 如 ,1991 年 时 (s 时 ), 有 2285 名 黑人 
和 15369 名 白人 被 抽 中 作为 样本 个 体 ,而 2001 年 时 (zt 时), 有 3403 名 黑人 和 
20182 名 白人 被 抽 中 作为 样本 个 体 。 对 于 顺序 1 的 反 事实 , cs) = 0. 1443 A 
ca (1) = 0. 1296。 然后 ,权重 被 计算 为 w(1) = 0. 1296/0. 1443 = 0. 8897, w(0) 
= 0. 8704/0. 8557 = 1.0076, 对 于 顺序 2 的 反 事 实 ,权重 被 计算 为 wad) = 
0. 1443/0. 1296 = 1. 1134, w(0) = 0. 8557/0. 8704 = 0. 9831, 这 些 权重 在 计算 
不 平等 测量 的 过 程 中 ,应 被 处 理 成 分 析 性 权重 。[L15] 

这 种 二 分 变量 的 情形 可 被 推广 至 多 类 别 的 情形 。 设 想 有 K 个 类 别 , 因 此 x 
从 1, =, 开 中 取 值 。 第 & 个 类 别 的 人 口 比例 被 记 为 c(&) 。 每 个 类 别 的 权重 为 : 


cs Ck) 


wk) = c(h) 





我 们 可 以 直接 用 这 些 权 重 来 计算 加 权 不 平等 测量 ,并 以 DASP 程序 来 检验 
它们 差异 的 显著 性 。 以 这 种 方式 , 反 事 实 分 解 可 被 应 用 于 任何 概要 不 平等 测 
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量 。 表 7. 1 给 出 了 基尼 系数 G ERK TA ARGE: RTM RK 
排序 之 间 的 成 分 求 平 均值 ,在 本 例 中 ,两 者 相似 。 结 果 表 明 ,种 族 既 定 情况 下 的 
条 件 收 入 分 布 对 整体 不 平等 的 压倒 性 影响 (97. 4% 一 97. 9%) FEIX 10 年 间 有 所 

在 我 们 的 例子 中 ,种族 既定 情况 下 的 条 件 收入 分 布 与 给 定 教育 情况 下 的 条 
件 收 入 分 布 混淆 在 一 起 ,仅仅 根据 种 族 来 进行 的 简单 分 析 具 有 误导 性 。 通 常 ， 
我 们 会 引入 多 类 别 和 连续 协 变量 来 更 好 地 解释 反应 变量 。 当 存在 多 个 分 类 变 
量 或 恰好 一 个 协 变量 为 连续 变量 时 ,上 述 方 法 并 不 适用 。 要 在 这 些 更 复杂 的 情 
形 中 ,得 到 与 上 面 我 们 对 单一 分 类 协 变量 所 做 的 分 析 类 似 的 趋势 分 析 , 需 要 引 
入 一 种 基于 模型 的 分 解 , 我 们 在 模型 中 以 一 些 协 变量 来 表达 反应 变量 的 分 布 。 
我 们 现在 转向 一 种 基于 模型 的 分 解 方法 。 


表 7.1 收入 不 平等 的 非 基 于 模型 的 分 解 :SIPP(2001 年 ) 





分 人 解 G T Ai 

1991 年 实际 的 :F(yi; Ci) 0. 381 0. 240 0.121 
2001 年 实际 的 :F(Cy ;C:) 0. 422 0. 307 0. 148 
整体 变化 0. 041 0. 067 0. 027 
反 事实 顺序 l:F(y; Cı) 

构成 成 分 0. 001 0. 001 0. 001 

条 件 成 分 0. 040 0. 066 0. 027 
反 事 实 顺 序 2:F(y ; C2 ) 

构成 成 分 0. 001 0. 002 0. 001 

条 件 成 分 0. 039 0. 066 0. 026 
反 事 实 顺 序 1 和 2 的 平均 

构成 成 分 0. 001 0. 001 0. 001 

条 件 成 分 0. 040 0. 066 0. 026 
百分比 贡献 

构成 成 分 2.5 2i 2.6 

条 件 成 分 97.5 97.9 97.4 

资料 来 源 :SIPP。 


对 两 个 时 期 的 工资 变化 进行 分 析 的 奥 扎 卡 一 布 林 德 回归 分 解 方法 ,一 直 被 
广泛 使 用 (DiNardo et al. , 1996; Juhn et al. , 1993; Oaxaca，1973) 。 基 于 条 件 
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均值 模型 的 线性 回归 模型 ,将 工资 的 时 间 变 化 分 解 成 一 个 反映 协 变量 效应 变化 
的 成 分 和 一 个 反映 协 变量 构成 变化 的 成 分 。 但 是 ,在 拟 合 条 件 均值 模型 时 , 形 
状 改变 被 吸收 到 残 差 中 。 为 了 以 条 件 均 值 和 条 件 形状 来 充分 刻画 条 件 分 布 的 
特征 , 马 沙 杜 (Machado) 和 玛 塔 (Mata)(2005) 使 用 分 位 数 回归 ,将 条 件 平 均 工 
资 扩 展 为 条 件 分 位 数 工资 (Machado & Mate，2005)。 然 后 ,估计 的 分 位 数 回归 
(CQR) 系 数 与 协 变量 的 分 解 一 并 用 于 构建 基于 模型 的 .实际 和 反 事 实 的 边缘 工 
资 分 布 。 将 基于 模型 的 实际 边缘 分 布 和 反 事 实 的 边缘 分 布 进 行 比较 ,就 得 到 了 
与 构成 成 分 和 条 件 分 布 成 分 有 关 的 结论 。 马 沙 杜 和 玛 塔 的 分 布 方法 为 对 所 有 
不 平等 测量 进行 基于 模型 的 分 解 提 供 了 便利 。 

作为 一 个 例子 ,我 们 将 前 面 根据 单个 分 类 协 变量 的 分 析 扩 展 到 协 变量 向 量 
中 ,包括 种 族 、 教 育 .年龄 和 常数 项 [16] 自 此 以 后 ,符号 oe 将 被 用 来 指 代 这 样 的 
一 个 协 变量 向 量 。 分 别针 对 每 一 时 期 1 的 分 位 数 回归 模型 (QRM) 可 被 表达 如 
下 (Hao & Naiman, 2007): 

Yt = fee He? 
这 里 , 0 二 pp 二 1 表示 人 口 的 累积 比例 。 那 么 ,第 p 个 条 件 分 位 数 为 每 一 时 间 上 
给 定 x 的 情况 下 ,y 的 函数 : 
QP Cy | ce = Bhar 


t 时 的 第 p 个 条 件 分 位 数 以 分 位 数 别 . 时 间 别 参数 BB 和 协 变量 zx, 的 取 值 来 
进行 估计 。 

基于 模型 的 分 解 方法 将 收入 不 平等 从 时 间 1 到 时 间 2 的 整体 变化 分 解 成 
协 变量 的 构成 和 给 定 协 变量 情况 下 ,收入 的 条 件 分 布 。 我 们 通过 基于 估计 的 
QR 系数 Be 和 所 有 协 变量 C 的 实际 分 布 的 边缘 化 ,来 构造 基于 模型 的 边缘 
分 布 : 


Fy: | Bes CD = (Bis CD)G 一 1，2) 
反 事 实 边 缘分 布 被 定义 如 下 : 


F Cy, | Bes GC) = (Bas C Ga = l; 2 s=1, 2Ht+s) 
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顾名思义 , 反 事 实 分 布 表 示 , 如 果 s 时 的 协 变量 构成 起 作用 ,那么 ,: 时 将 会 
盛行 何 种 收入 分 布 。 
根据 构建 的 实际 边缘 分 布 ,我 们 可 以 估计 任 一 不 平等 测量 , 记 为 了 (B,; 
。 同 样 ,根据 构建 的 反 事实 边缘 分 布 ,我 们 可 以 估计 对 应 的 测量 , 记 为 了 (6,; 
。 通 过 比较 这 些 测量 ,我 们 得 到 了 一 个 两 成 分 分 解 : 
Af = ?2 一? 
= thes 108 CS L7. 2] 
= {I(B2; C2) —I( B23 C1)}+{I(B2; C1) — ICi; Ci)) 


在 这 里 ,估计 的 不 平等 差异 被 区 分 成 两 个 差 值 项 。 第 一 个 差 值 项 固定 了 时 
间 2 处 的 系数 ,但 允许 协 变量 构成 在 两 个 时 间 之 间 变 动 ,因此 反映 了 由 所 有 协 变 
量 构 成 上 的 变化 所 导致 的 整体 不 平等 测量 的 变化 。 第 二 个 差 值 项 固定 了 时 间 1 
处 的 协 变 量 构成 ,但 允许 系数 从 时 间 1 到 时 间 2 发 生变 化 ,因此 ,反映 了 由 系数 
上 的 变化 所 导致 的 整体 不 平等 的 变化 。 

方程 7. 2 中 的 不 平等 测量 建立 在 基于 模型 的 边缘 分 布 的 基础 之 上 。 对 大 量 
(但 小 于 样本 规模 ) 分 位 数 进行 建 模 , 有 助 于 刻画 分 布 的 特征 ,但 并 不 会 再 现 分 
布 。 因 此 ,我们 需要 同时 使 用 图 形 方法 和 数值 方法 来 描绘 观测 的 边缘 和 建构 的 
边缘 之 间 的 差异 。 给 出 一 个 图 形 展 示 和 估计 出 整体 不 平等 测量 中 未 被 解释 的 
变异 是 有 益 的 : 

T 一 人 十 全 

下 面 ,我 们 对 用 来 获得 基于 模型 的 (程序 AD 和 基于 反 事 实 的 (程序 B) 边 缘 
样本 的 经 验 程序 进行 逐步 描述 。 两 个 程序 都 基于 以 下 思路 ,从 它们 对 应 的 边缘 
分 布 中 得 到 近似 样本 :对 于 从 (0, 1) 中 随机 选取 的 分 位 数值 ,我 们 从 一 个 时 期 抽 
取 了 一 行 协 变量 数据 ,并 将 该 行 插入 对 相同 时 期 或 其 他 时 期 拟 合 得 到 的 分 位 数 
回归 模型 中 。 所 得 到 的 反应 变量 值 将 具有 正确 的 边缘 分 布 。 

程序 A 包含 以 下 步骤 ,以 允 近 每 一 时 间 上 基于 模型 的 边缘 分 布 :(1) 从 均匀 

分 布 U(0, 1) 中 随机 地 选取 一 个 口 ; (2) 使 用 完整 的 t 时 数据 来 估计 第 口 个 分 位 
数 回归 ;(3) 从 :时 数据 中 选取 一 个 规模 为 40 的 自 举 法 样本 ,并 根据 分 位 数 回归 
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模型 估计 值得 到 40 个 预测 值 ; 4) 根据 所 选取 的 各 行 协 变量 x, 和 分 位 数 回归 系 
BN BY ,计算 第 U 个 条 件 分 位 数 ;(5) 将 步骤 (1) 到 步骤 (4) 重 复 500 次 ;(6) 将 步 又 
(5) 中 得 到 的 值 (500X40 = 20000) 作为 从 基于 模型 的 yx* 的 边缘 分 布 中 抽取 的 
一 个 随机 样本 。 

程序 B 包 含 以 下 步骤 ,以 逼近 基于 模型 的 反 事实 边缘 分 布 :(1) 根 据 前 面 随 
机 抽取 时 间 1 处 的 各 行 数据 ci 和 估计 的 时 间 2 处 的 分 位 数 回归 系数 和 ,=z， 
计算 条 件 分 位 数 ,以 建构 一 个 从 反 事 实 边缘 分 布 y* Bi; cea) 中 抽取 的 样 
本 ;(2) 通 过 使 用 随机 抽取 的 时 间 2 处 的 各 行 数据 x= 和 估计 的 时 间 1 处 的 分 
位 数 回归 系数 和 ,-1, 能 够 建立 一 个 倒序 的 反 事实 边缘 ,以 建构 一 个 从 反 事 实 边 
缘分 布 y* (外 ,-1; z=) 中 抽取 的 样本 。 

我 们 使 用 1991 年 和 2001 年 的 SIPP 收入 数据 ,对 不 平等 测量 基于 模型 的 
分 解 方法 进行 了 举例 说 明 。 家 庭 户 收入 的 分 位 数 回 归 模 型 中 的 协 变量 包括 种 
族 ( 黑 人 相对 于 白人 ) 、 教 育 ( 大 学 教育 相对 于 非 大 学 教育 ) 和 生命 周期 (年 龄 
和 年 龄 平方 )。 我 们 得 到 了 1991 年 和 2001 年 基于 模型 的 边缘 分 布 On, 
Ci) 和 全 (yz,，Cz)。 我 们 首先 来 评价 模拟 的 边缘 分 布 在 多 大 程度 上 与 观测 的 
边缘 分 布 吻合 。 图 示 很 有 帮助 ( 见 图 7. 1)。 对 这 两 年 而 言 ,基于 模型 的 核 密 
度 曲线 大 大 保持 了 观测 核 密 度 曲线 的 位 置 `. 尺 度 和 形状 。 相 较 观 测 曲线 的 顶 
峰 ,1991 年 基于 模型 的 曲线 在 其 顶峰 处 略微 向 右边 移动 了 一 点 ,这 反映 了 两 
者 的 细微 差异 。2001 年 基于 模型 的 曲线 几乎 完全 与 观测 曲线 相同 。 将 表 7. 1 
AZ 7. 2 的 前 三 行 加 以 比较 ,我 们 发 现 ,1991 年 基于 模型 的 不 平等 实际 上 比 
观测 的 不 平等 更 低 , 这 导致 基于 模拟 数据 的 不 平等 出 现 了 比 观 测 数据 更 大 的 
整体 变化 。 

在 模拟 了 两 种 顺序 (yz, C1) 和 个 (y1，C2) 的 情况 下 基于 模型 的 反 事实 边 
缘分 布 后 ,我 们 得 到 了 4 个 模拟 的 边缘 分 布 ,根据 这 些 分 布 ,我 们 可 以 计算 不 平 
等 测量 并 进行 分 解 分 析 。 我 们 呈现 了 基尼 系数 G、 泰 尔 指数 T MERER A 
的 结果 。 为 了 对 趋势 的 显著 性 进行 检验 ,我 们 使 用 了 渐 近 标准 误 。 


评估 不 平等 





0 100 200 300 400 500 
收入 (1000 美 元 ) 





观测 的 ---- 基 于 模型 的 


(a) 核 密度 观测 
核 王 伊 氏 颗粒 ”带宽 一 4. 0222 


0. 015 


400 


收入 (1000 美 元 ) 


600 





---- 基 于 模型 的 





核 一 伊 氏 颗粒 


Cb) 核 密度 观测 


带宽 一 4. 0222 


7.1 观测 的 对 基于 模型 的 收入 边缘 分 布 :1991 年 和 2001 年 的 SIPP 数据 


表 7.2 基于 模型 的 收入 不 平等 分 解 :SIPP(1991 年 和 2001 年 ) 





分 解 G T Aya 
1991 年 实际 的 :Cy ; Ci) 0. 362 0. 215 0.111 
2001 EKR: F Oz; Cr) 0. 422 0. 305 0. 147 
整体 变化 0. 059% 0. 090* 0. 036" 
反 事实 顺序 1: Fz; C) 
构成 成 分 0. 004 0. 008 0. 003 
条 件 成 分 0. 056” 0. 083°" 0. 033" 


反 事 实 顺序 2: FOr; C) 
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续 表 
分 解 G T Ain 

构成 成 分 0. 003 0. 004 0. 002 

条 件 成 分 0. 056” 0. 086™ 0. 034” 
反 事 实 顺序 1 和 2 的 平均 

构成 成 分 0. 004 0. 006 0. 003 

条 件 成 分 0. 056” 0. 084" 0. 034" 
百分比 贡献 

构成 成 分 6.0 6.7 7.5 

条 件 成 分 94.0" 93. 3” 92.5" 


注 :分 位 数 回归 模型 纳入 了 四 个 协 变量 :种 族 ( 黑 人 和 白人 ) .教育 (大 学 和 非 大 学 ) ,年龄 和 年 龄 平方 。 
xx 表示 P<O. 01, 
资料 来 源 :SIPP。 


这 10 年 间 , 以 这 3 个 不 平等 测量 测 得 的 收入 不 平等 的 增加 统计 上 显著 ( 见 
表 7.2 顶部 的 3 行 )。 如 果 分 位 数 回归 模型 被 正确 地 设 定 [1"] ,那么 此 分 解 表 
明 , 协 变量 (种 族 、 教 育 和 生命 周期 ) 上 的 构成 变化 并 未 显著 地 对 这 3 个 不 平等 测 
量 中 的 任意 一 个 的 整体 变化 产生 影响 。 恰 恰 是 条 件 分 布 ( 反 映 了 收入 的 分 类 机 
制 ), 几 乎 完全 解释 了 日 益 增 加 的 收入 不 平等 。 


小 结 


本 章 介 绍 了 将 两 个 时 点 之 间 不 平等 的 变化 分 解 成 协 变量 的 构成 变化 和 给 
定 协 变量 情况 下 ,反应 变量 条 件 分 布 的 变化 的 方法 。 适 用 于 一 个 分 类 变量 的 方 
法 属于 一 种 再 加 权 方 法 ,适用 于 一 个 连续 协 变量 或 多 个 协 变量 的 方法 属于 一 种 
使 用 分 位 数 回 归 的 基于 模型 的 方法 。 这 一 趋势 分 解 方法 提高 了 我 们 对 不 平等 
随时 间 变 化 的 来 源 进行 分 析 的 能 力 , 并 得 到 对 社会 机 制 更 深刻 的 认识 。 下 一 章 
将 应 用 本 书 所 介绍 的 大 部 分 分 析 工 具 , 对 1991 年 和 2001 年 的 收入 和 财富 的 不 
平等 进行 考察 。 


oar ae ps EDENI 


美国 收入 和 财富 的 不 平等 (1991 一 2001 年 ) 


本 章 使 用 SIPP 数据 ,提供 了 一 个 对 美国 1991 年 和 2001 年 家 庭 户 收入 和 财 
富 的 不 平等 进行 考察 的 真实 例子 。 它 是 对 前 面 各 章 所 介绍 工具 的 一 次 简要 应 
用 。 我 们 的 目的 在 于 确定 整个 人 口 和 不 同 社会 群体 的 收入 和 财富 不 平等 模式 ， 
以 及 这 些 模式 在 这 10 年 间 如 何 变 化 。 由 于 收入 和 财富 在 家 庭 户 内 被 共享 , 因 
此 ,我 们 以 家 庭 户 为 分 析 单 位 。 我 们 出 于 理论 和 方法 论 的 目的 来 考察 收入 和 财 
富 。 理 论 上 来 说 ,家 庭 户 资源 可 被 看 成 由 收入 所 反映 的 流量 和 由 财富 所 反映 的 
存量 。 收 入 和 财富 之 间 的 关系 较为 复杂 。 具 体 而 言 ,投资 收入 和 储蓄 为 影响 这 
一 关系 的 因素 的 例子 。 因 此 ,同时 对 收入 和 财富 的 不 平等 进行 考察 ,可 以 提供 
更 完整 的 家 庭 户 资源 不 平等 的 图 景 。 方 法 论 上 来 说 , 像 收 入 研究 文献 中 所 做 的 
那样 ,我 们 应 用 大 部 分 工具 对 收入 进行 考察 。 在 收入 的 例子 中 ,我 们 关注 正 的 
收入 取 值 ,因为 负 收 入 和 零 收 入 家 庭 户 的 比例 较 小 。 但 是 ,考察 财富 不 平等 需 
要 一 套 不 同 的 工具 , 因为 资产 净值 (总 资产 减 总 负债 ) 为 负 值 和 零 值 的 比例 较 
大 。 收 入 和 财富 之 间 的 对 比 提醒 我 们 ,恰当 工具 的 选择 取决 于 所 讨论 的 现象 。 
SIPP 同时 收集 了 有 关 收 入 和 财富 的 详细 信息 ,这 使 它 成 为 适合 本 研究 的 一 个 恰 
当 数 据 来 源 。SIPP 使 用 多 阶段 整 群 分 层 抽样 设计 ,同时 被 选 人 样本 的 家 庭 户 具 
有 不 同 的 抽样 权重 。 本 例 的 分 析 考 虑 了 抽样 权重 和 调查 抽样 设计 。 我 们 用 
Stata 中 的 用 户 编写 程序 ineqdeco 和 ineqdec0 (Jenkins，1999) 、glcurve (Van 
Kerm & Jenkins, 2001) reldist(Jann, 2008) 和 DASP(Duclos & Araar, 2006) 
( 见 附 表 A3) 来 完成 分 析 。 


566 


i 社会 科学 中 的 数理 基础 及 应 用 


描述 性 统计 


K 8. 1 给 出 了 分 析 中 所 用 到 变量 的 加 权 描述 性 统计 。 年 收入 通过 将 1991 
年 和 2001 年 中 的 月 家 庭 户 总 收入 加 总 得 到 。 我 们 只 对 取 正 数值 的 年 收入 进行 
分 析 , 因 此 ,排除 了 1991 年 的 53 个 (0. 25%%) 零 收入 家 庭 户 .838 个 (4. 02% 
入 缺失 家 庭 户 (没有 负数 收入 的 家 庭 户 ) 以 及 2001 年 的 4 个 (0.01%) 负 数 收入 
家 庭 户 和 100 个 (0. 35%) 零 收入 家 庭 户 (没有 收入 缺失 的 家 庭 户 )。 由 于 这 些 非 
正 数值 收入 的 家 庭 户 所 占 的 比例 相对 较 小 ,所 以 ,删除 它们 只 会 最 小 地 影响 收 
入 不 平等 模式 。 相 比 而 言 ,1991 年 时 ,1751 个 (8. 4%) 家 庭 户 的 资产 净值 为 负 
数 ,916 个 (4. 4%) 家庭 户 的 资产 净值 为 0。2001 年 时 ,相应 的 数字 为 3546 
(12. 9%) 和 1158(4. 2%) ,我 们 无 法 在 不 影响 不 平等 模式 的 情况 下 ,忽略 总 资产 
净值 分 布 的 这 些 部 分 。 收 入 和 资产 净值 都 以 2001 年 不 变 的 美元 来 表示 ,因此 ， 
它们 在 时 间 上 是 可 以 被 比较 的 。 表 8. 1 第 一 行 显示 ,收入 和 资产 净值 的 均值 从 
1991 年 到 2001 年 一 直 在 增加 。 

社会 结构 在 决定 一 个 家 庭 户 以 收入 和 财富 形式 来 表现 的 位 置 中 起 着 重要 
作用 。 基 于 社会 分 层 理 论 ,我 们 找 出 了 6 个 社会 分 组 变量 :种 族 或 民族 (白人 、 黑 
人 \ 西 班 牙 裔 、 其 他 )、 年 龄 组 (年 龄 在 45 岁 以 上 的 户主 对 年 轻 户主 )、 受 教育 群体 
(高 中 以 下 高 中 大 学 律 业 和 大 学 或 以 上 )、 家 庭 户 类 型 (已 婚 无 子女 .已 婚 有 子 
女 单身 母亲 .单身 男子 .单身 女子 和 其 他 )、. 区 域 (东北 部 .中 西部 .南部 和 西部 ) 
以 及 家 庭 户 环境 (城市 区 或 非 城市 区 ) 。 表 8. 1 中 的 “比例 ”一 列表 明 , 这 些 社会 
群体 的 人 口 比例 从 1991 年 到 2001 年 有 所 变化 。 我 们 看 到 ,少数 种 族群 体 、 高 龄 
群体 、 高 教育 群体 、 未 婚 家 庭 户 类 型 .南部 居民 和 城市 区 居民 在 增加 。 我 们 随后 
会 讨论 社会 分 组 的 这 些 构成 变化 是 否 会 对 收入 和 财富 不 平等 的 变化 产生 影响 ， 
并 关注 这 些 影响 的 程度 。 

“平均 收入 ” 列 和 “平均 资产 净值 ” 列 给 出 了 每 一 个 社会 群体 在 1991 年 和 
2001 年 的 平均 数值 。 尽 管 除了 3 个 群体 之 外 ,其 他 群体 在 这 10 年 间 , 收 入 和 资 
产 净值 有 所 增加 ,但 似乎 优势 群体 获 益 更 多 ,包括 白人 、 年 长 者 、 受 最 高 教育 者 、 
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已 婚 家 庭 户 类 型 .单身 男子 家 庭 户 和 城市 区 居民 。 除 了 受 最 高 教育 者 之 外 ,所 有 
育 群 体 的 平均 收入 都 随时 间 而 下 降 。 无 高 中 文凭 的 那些 家 庭 户 的 平均 资产 净 
ee 
出 一 个 少量 的 上 升 。 相 比 而 言 , 大 学 和 高 等 教育 在 这 10 年 期 间 导致 了 资产 净值 的 
最 大 提高 。 同 时 考察 收入 和 资产 净值 会 得 到 有 关 家 庭 户 资源 的 更 多 洞 见 
些 描述 性 统计 是 有 益 的 ,但 它们 并 没有 就 整个 人 口 的 不 平等 给 
个 明确 的 判断 ,因此 ,我 们 利用 图 形 展示 和 概要 不 平等 测量 来 考察 观测 的 不 平 
等 模式 。 


表 8.1 总 的 和 按 社 会 群体 划分 的 收入 和 财富 的 加 权 描 述 统计 :SIPP(1991 年 和 2001 年 ) 








1991 2001 
变 量 比例 平均 收入 ”平均 资产 净值 比例 平均 收入 ”平均 资产 净值 
(美元 ) (美元 ) (美元 ) (美元 ) 

整体 1. 00 47908 118468 1. 00 51040 173993 
种 族 / 民 族 

白人 0. 80 50609 134857 0.75 54168 210377 

黑人 0. 10 32190 35391 0. 12 35797 45472 

西班牙 裔 0. 07 37144 49368 0. 09 40998 57905 

其 他 种 族 0. 03 52660 120371 0. 04 61419 151915 
年 龄 组 

年 龄 一 45 0. 49 49155 61968 0. 45 52687 83292 

aE S45 0.51 46717 173087 0.55 49699 247818 
教育 群体 

高 中 以 下 0. 23 28728 75755 0. 14 26541 57946 

高 中 0. 35 43406 98923 0. 30 40387 114691 . 

KER 0. 20 50956 114462 0. 30 48277 140135 

大 学 或 以 上 0.22 72514 199006 0. 26 78964 345826 
家 庭 户 类 型 

已 婚 无 子女 0. 23 54859 196067 0. 23 59280 282636 

已 婚 有 子女 0. 33 63561 123768 0. 28 72490 207784 

单身 母亲 0. 10 31483 47476 0. 11 32983 50835 

单身 男子 0. 10 33560 75756 0. 11 34695 149631 

单身 女子 0. 15 23615 87771 0. 15 23726 112522 

其 他 0. 09 48347 85923 0.11 50916 91618 
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续 表 
1991 2001 
变 量 平均 收入 ”平均 资产 净值 平均 收入 ”平均 资产 净值 
比例 2 ii 比例 2 i 
(美元 ) 《美元 ) (美元 ) (美元 ) 

区 域 

东北 部 0. 20 51773 144972 0. 19 55651 185108 

中 西部 0. 26 47149 108245 0. 23 51267 154291 

南部 0. 34 42949 93983 0. 37 46314 140224 

西部 0. 20 53192 145834 0. 21 54834 243909 
城市 区 

是 0. 74 51041 123957 0.77 54102 190311 

否 0. 26 39458 102839 0. 23 40761 119213 
连续 型 协 变量 

年 龄 48. 00 49. 00 

受 教育 年 数 12.72 13. 14 

家 庭 户 规模 2.39 2. 30 
样本 量 N 20838 27398 
资料 来 源 :SIPP。 
观测 的 收入 和 财富 的 不 平等 


图 形 展示 有 助 于 直观 地 显示 整个 分 布 。 图 8. 1 中 左 侧 的 3 幅 图 提供 了 年 收 
入 的 分 位 数 函 数 、 洛 伦 兹 曲线 和 广义 洛 伦 兹 曲线 , 右 侧 的 3 幅 图 提供 了 资产 净值 
的 同一 组 图 形 。 由 Stata 中 的 “pctile” 创 建 的 分 位 数 函 数 显示 ,收入 和 资产 净值 
的 2001 年 曲线 从 p70 及 以 上 开始 偏离 相应 的 1991 年 曲线 。 资 产 净值 上 的 偏离 
大 于 收入 的 情况 。 这 意味 着 ,时 间 上 的 变化 被 集中 在 此 分 布 的 上 部 1/3。 

使 用 詹金斯 和 凡 ， 克 尔 曼 编写 的 “glcurve” 程 序 (Jenkins & Van Kerm, 
2004) ,我 们 得 到 了 1991 年 和 2001 年 的 洛 伦 效 曲线 和 广义 洛 伦 效 曲线 。 洛 伦 效 
曲线 以 反应 变量 均值 进行 了 标准 化 ,从 而 排除 了 尺度 改变 。 因 此 ,我 们 用 洛 伦 
效 曲线 来 对 这 两 年 的 分 布 之 间 的 位 置 移动 和 形状 改变 进行 比较 。 引 起 我 们 注 
意 的 第 一 件 事 是 ,资产 净值 的 洛 伦 兹 曲线 和 完全 平等 线 之 间 的 面积 远 远大 于 收 
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入 的 情况 ,这 表明 ,财富 上 的 不 平等 比 收 入 上 的 不 平等 更 严重 ,这 与 文献 中 所 提 
到 的 一 致 。 第 二 ,我 们 看 到 ,收入 和 资产 净值 的 2001 年 洛 伦 兹 曲线 都 处 在 1991 
年 相应 的 洛 伦 兹 曲线 下 方 ,这 意味 着 ,2001 年 的 收入 或 资产 净值 洛 伦 兹 占 优 于 
1991 年 的 收入 或 资产 净值 。 我们 以 底部 ,中 部 和 顶部 敏感 的 不 平等 测量 
(GE-20、GE1 和 GE2zo ,这 里 未 显示 结果 ) 对 1991 年 和 2001 年 的 洛 伦 兹 占 优 做 
了 一 个 正式 检验 ,证 明 2001 年 收入 分 布 洛 伦 效 占 优 于 1991 年 收入 分 布 。 不 过 ， 
对 资产 净值 做 此 类 正式 检验 并 不 那么 简单 直接 ,因为 底部 敏感 的 不 平等 测量 并 
不 能 被 用 于 资产 净值 的 负数 值 。 我 们 对 正 数 值 部 分 的 差异 使 用 GE! 和 GEzo， 
证 明 2001 年 资产 净值 分 布 的 正 数值 部 分 占 优 于 1991 年 的 相应 情况 。 


收入 资产 净值 
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So 
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50 
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(a) 分 位 数 函 数 


资产 净值 





1 1 

9 9 

8 8 

7 7 

6 6 

5 5 

4 4 

3 3 

2 外 .25 二 

1[ 1a aa 

00 0.10.20.30.40.50.60.70.80.9 1 00 0.10.20.30.40.50.60.70.80.9 1 
累积 人 口 比 例 累积 人 口 比 例 

一 一 1991 ----2001 ”一 一 完全 平等 ===- 2001 == 完全 平等 





b) 洛 伦 效 曲线 
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收入 
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Co) 广义 洛 伦 兹 曲线 


图 8.1 加 权 的 收入 和 财富 分 布 的 图 形 展示 :分 位 数 函 数 、 洛 伦 兹 曲线 和 广义 洛 伦 兹 曲线 


广义 洛 伦 兹 曲线 通过 将 洛 伦 兹 曲线 乘 以 平均 收入 或 财富 而 得 到 。y 轴 的 重 
新 尺度 化 提醒 我 们 ,尽管 收入 和 财富 的 不 平等 从 1991 年 到 2001 年 有 所 增加 ,但 
因 收 入 和 财富 而 带 来 的 福利 在 同时 期 却 有 所 改善 。 

除了 图 形 展示 ,还 可 以 计算 精确 的 概要 不 平等 测量 。 我 们 挑选 一 套 能 够 提 
供 补充 信息 来 形成 更 完整 的 不 平等 图 景 的 测量 。 我 们 使 用 杜 克 罗 斯 和 阿拉 尔 
编写 的 DASP 程序 来 得 到 1991 年 和 2001 年 时 加 权 的 收入 和 财富 的 不 平等 测 
量 , 也 可 以 对 收入 和 财富 分 别 使 用 詹金斯 编写 的 “ineqdeco” 和 “ineqdec0” 作 为 替 
代 (Jenkins, 1999)。 每 一 年 的 结果 以 及 它们 的 绝对 和 相对 差异 呈现 在 表 8. 2 
中 ,顶部 为 收入 的 情况 ,底部 为 资产 净值 的 情况 。 

我 们 先 考察 收入 不 平等 。 从 分 位 数 比 开始 ,因为 它 具 有 计算 简单 且 易 于 解 
释 的 优点 。p10/p50( 第 十 个 百 分 位 数 与 中 位 数 之 比 ) 描 述 了 分 布下 半 部 的 大 部 
分 ,而 p90/p50 则 描述 了 上 半 部 的 大 部 分 。 下 降 的 p10/p50 和 上 升 的 p90/ p50 
共同 反映 了 收入 不 平等 的 日 益 加 重 。 收 入 上 众 数 处 敏感 的 基尼 系数 的 增加 证 
实 了 分 布 的 中 部 存在 更 大 的 收入 不 平等 。 我 们 用 到 了 广义 炳 敏感 参数 的 4 个 取 
值 (一 1、0、1 和 2)。 随 着 每 一 个 参数 的 取 值 的 增 大 ,敏感 性 从 分 布 的 底部 移 到 
了 顶部 。 全 部 4 个 广义 炉 测 量 从 1991 年 到 2001 年 , 均 呈 现 出 增加 的 趋势 ,其 中 
一 个 增加 集中 在 两 端 而 不 是 中 部 。 底 部 敏感 的 GE_1 呈现 出 几乎 200% 的 增加 ， 





评估 不 平等 


表 8.2， 加 权 的 收入 和 财富 的 不 平等 测量 :SIPP(1991 年 和 2001 年 ) 





测 量 1991 2001 变化 百分比 变化 

收入 

p10/ p50 0. 290 0. 286 —0. 004 —1. 38 
p90/ p50 2. 294 2. 494 0. 200 8. 72 
基尼 0. 382 0. 422 0. 039 10. 21 
GE_, 1, 288 3. 859 2.571 199. 61 
GE, 0. 284 0. 346 0. 061 21. 48 
GE, 0. 240 0. 308 0. 068 28. 33 
GE; 0. 265 0. 404 0. 139 52. 45 
Aos 0. 121 0. 148 0. 027 22. 31 
Ai 0. 247 0. 292 0. 045 18. 22 
Ap 0. 720 0. 885 0. 165 22. 92 
资产 净值 

p75/ p25 26. 464 46, 224 19. 760 74. 67 
p90/ p50 6. 715 7,421 0. 706 10. 51 
kes ra" 0. 124 0. 045 一 0. 080 一 64. 52 
基尼 0. 694 0. 763 0. 069 9. 94 
GE; 1, 455 40. 970 39. 515 2715. 81 

资料 来 源 :SIPP。 


顶部 敏感 的 GEz 呈现 出 超过 50% 的 增加 。 这 些 测量 提供 了 与 图 8. 1 中 的 分 位 
数 函 数 并 未 反映 出 来 的 收入 分 布 底 端 尾部 变化 有 关 的 额外 信息 。 指 数 的 阿 特 
金森 族 提 供 了 一 个 不 平等 厌恶 视角 。 随 着 厌恶 变 得 更 强烈 ,收入 不 平等 的 水 平 
和 变化 也 变 得 更 高 和 更 大 ,但 百分比 变化 并 不 如 此 。 

我 们 现在 转向 对 资产 净值 的 研究 。 因 为 资产 净值 可 以 取 负 值 ,因此 ,选择 
哪些 分 位 数 应 用 来 构造 比值 就 需要 谨慎 ,以 避免 出 现 负 的 分 位 数 比 ,其 原因 仅 
仅 是 这 些 比 值 难以 解释 。 比 值 p75/p25 反映 了 中 间 50% 的 人 口 之 间 的 资产 净 
值 不 平等 。 这 一 人 口 的 中 间 一 半 的 财富 不 平等 已 经 较 大 , 且 它 在 此 10 年 期 间 大 
大 增加 。p90/p50 在 7 附近 ,时 间 相 对 稳定 ,这 与 上 面 洛 伦 兹 曲线 的 比较 共同 表 
明 ,富裕 恰好 存在 于 第 90 个 百 分 位 数 处 。 我 们 进一步 考察 底部 50% 对 顶部 5% 
的 份额 比 。 如 果 将 整个 人 口 的 财富 看 做 一 块 饼 ( 资 产 净 值 的 正 数值 和 负数 值 之 
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和 ) ,下 半 部 分 的 人 口 比 顶 部 5 狼 的 人 口 拥有 一 块 小 得 多 的 饼 , 因 为 1991 年 时 ， 
它们 的 比值 只 为 0. 124，2001 年 时 ,进一步 下 降 至 0. 045。 尽 管 资产 净值 的 基尼 
系数 比 收 入 的 基尼 系数 大 得 多 ,但 收入 基尼 系数 和 资产 净值 基尼 系数 的 增长 率 
相似 , 约 为 10%。 总 的 来 说 , 表 8. 2 中 选取 的 不 平等 测量 表明 ,收入 和 财富 的 不 
平等 在 这 10 年 间 都 增加 了 。 不 过 ,这 些 结果 是 否 统计 显著 ,需要 看 我 们 后 面 将 
要 进行 的 假设 检验 。 

在 6 个 社会 分 组 变量 中 ,组 平均 差异 如 何 促成 总 的 不 平等 ? 哪个 分 布 变量 
的 贡献 更 大 ? 这 些 群 体 贡献 会 随时 间 而 变化 吗 ? 我 们 用 组 分 解 工具 来 回答 这 
些 问题 ,这 里 集中 关注 基尼 系数 和 4 个 不 同 敏感 性 参数 的 广义 粹 GE。 组 间 成 
分 被 定义 为 每 一 群体 中 的 成 员 具 有 与 该 群体 的 平均 财富 相等 的 财富 取 值 ,而 非 
群体 成 员 具 有 不 同 的 财富 取 值 情况 下 的 群体 间 不 平等 。 我们 注意 到 ,除了 反映 
组 平均 差异 之 外 ,组 分 解 将 被 分 解 成 这 一 计算 ,也 就 是 说 ,相对 群体 规模 会 有 影 
响 。 我 们 用 DASP 程序 得 到 了 表 8. 3 中 所 示 的 结果 。 以 种 族 或 民族 分 组 为 例 ， 
从 项 部 的 收入 情况 看 ,组 间 部 分 对 基尼 系数 贡献 了 13. 42% ,对 CE-1 贡 献 得 非 

常 少 ,而 对 GE-1、GE! 和 GE2 贡献 了 约 4%。 种 族 或 民族 的 这 些 贡 献 在 这 10 

年 间 极其 稳定 。 应 当 记 住 的 是 ,尽管 广义 焙 族 是 加 和 可 分 解 的 ,但 基尼 系数 不 
是 。 我 们 看 到 ,种族 或 民族 对 基尼 系数 的 贡献 较 大 , 且 它 在 这 10 年 间 略 有 增加 。 
通过 考察 不 同 的 分 组 变量 ,我们 会 看 到 两 种 模式 。 第 一 ,6 个 分 组 变量 中 ,教育 
群体 和 家 庭 户 类 型 的 组 间 成 分 是 总 收入 不 平等 的 最 大 促成 因素 。 第 二 ,这 些 组 
间 成 分 的 贡献 在 此 10 年 间 变化 适中 。 

但 是 ,资产 净值 上 出 现 了 不 同 模式 ( 表 8. 3 的 底部 )。 反 映 财富 积累 上 生命 
周期 差异 的 年 龄 分 组 与 教育 群体 和 家 庭 户 类 型 一 起 ,对 总 财富 不 平等 有 更 大 的 

贡献 。 根 据 加 和 可 分 解 性 ,各 组 间 成 分 对 GEs 的 递减 贡献 意味 着 , 低 端 尾部 的 

组 间 变 异 在 2001 年 比 在 1991 年 起 着 更 大 的 作用 。 相 反 , 根 据 非 加 和 可 分 解 性 ， 
各 组 间 成 分 (有 一 个 例外 ) 对 基尼 系数 的 递增 贡献 表明 ,组 平均 差异 对 2001 年 时 
的 中 间 部 分 比 1991 年 时 起 着 更 重要 的 作用 。 

家 庭 户 会 有 各 种 各 样 的 财富 投资 组 合 。 我 们 关注 3 个 类 别 一 一 房产 净值 
(房产 价值 减 去 抵押 ) .金融 资产 净值 (个 人 退休 金 账户 .银行 账户 .股票 .公募 基 
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金 等 减 去 抵押 品 ) 以 及 房地产 净值 、 贷 借 净 值 和 医疗 债务 等 其 他 资产 净值 。 我 
们 用 DASP 程序 对 基尼 系数 进行 了 按 来 源 的 分 解 。 表 8. 4 显示 ,金融 资产 净值 
对 总 的 基尼 系数 做 了 最 大 的 百分比 贡献 ,这 一 贡献 从 1991 年 到 2001 年 有 所 下 
降 。“ 其 他 ”类 在 1991 年 作出 了 一 个 负 的 百分比 贡献 ,意味 着 该 类 中 的 负债 超过 
了 资产 。 这 在 2001 年 时 是 正 的 。 


表 8.3 组 间 成 分 对 收入 和 财富 不 平等 的 加 权 百 分 比 贡 献 :SIPP(1991 年 和 2001 年 ) 
种 族 年 龄 教育 家 庭 户 类 型 区 域 农村 





收入 (1991 年 ) 

基尼 13. 42 3.41 44. 27 45. 16 12.18 12.39 
GE_, 0. 85 0. 03 3.73 5.01 0. 27 0. 48 
GE, 3. 68 0, 12 17. 08 20. 77 1. 29 2.19 
GE, 3. 95 0. 15 19. 90 21. 99 1.52 2. 48 
GE: 3. 25 0.13 18. 19 18. 26 1. 37 2.14 
收入 (2001 年 ) 

基尼 14. 85 3. 63 44, 24 46. 62 9. 81 10. 91 
GE, 0. 32 0. 01 1. 66 2.21 0. 08 0. 18 
GE, 3. 31 0. 14 17. 50 21.18 0. 84 1. 93 
GE, 3. 48 0. 15 19. 38 21. 38 0. 94 2.05 
GE: 251 0. 12 15. 15 15. 26 0.71 1. 48 
资产 净值 (1991 年 ) 

基尼 16.22 33.41 27, 07 31. 46 14. 63 5. 35 
GE; 3. 07 7.45 4.76 5.59 1. 26 0. 21 
资产 净值 (2001 年 ) 

基尼 21. 21 30.64 39.61 33. 05 15. 43 9. 46 
GE, 0.17 0. 27 0. 44 0. 24 0. 06 0. 04 
资料 来 源 :SIPP。 


表 8.4 来 源 类 别 对 资产 净值 基尼 系数 的 加 权 百 分 比 贡献 :SIPP(1991 年 和 2001 年 ) 





类 Fil 1991 2001 
房产 净值 0. 38 0. 31 
金融 资产 净值 0. 79 0. 59 
其 他 一 0. 18 0. 10 


资料 来 源 :SIPP。 
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检验 收入 和 财富 不 平等 的 变动 趋势 


针对 整个 人 口 和 总 的 不 平等 测量 的 群体 或 来 源 分 解 , 我 们 已 经 讨论 过 观测 
到 的 各 种 收入 和 财富 不 平等 测量 的 模式 。 我 们 现在 来 考虑 对 这 些 测量 的 趋势 
的 显著 性 进行 检验 ,涉及 对 它们 的 时 间 变 化 的 推断 。 如 第 6 章 中 所 讨论 的 , 当 样 
本 规模 较 大 (比如 ,大 于 1000) 时 , 渐 近 方法 适合 用 来 确定 大 多 数 概要 不 平等 测 
量 在 简单 随机 抽样 情况 下 的 近似 抽样 分 布 。 然 而 ,各 种 调查 经 常 涉及 必须 在 渐 
近 方 法 中 加 以 考虑 的 复杂 抽样 设计 。 对 一 套 普 遍 使 用 的 概要 不 平等 测量 ,我 们 
用 DASP 软件 包 来 进行 此 分 析 。 

表 8. 5 显示 了 对 与 表 8. 2 中 相同 的 一 套 不 平等 测量 的 时 间 变 化 进行 检验 的 
结果 。 我 们 给 出 了 每 一 个 测量 的 变化 .p 值 和 95% 置 信 区 间 。 我 们 注意 到 , 表 
中 所 有 的 收入 不 平等 测量 的 变换 都 在 0. 01 水 平 上 显著 ,除了 收入 的 p10/p50 
比值 上 的 变化 和 资产 净值 的 GE。 上 的 变化 统计 不 显著 之 外 。 换 言 之 , p10/p50 
收入 比值 上 估计 的 最 小 下 降 ( 一 0. 004) 可 忽略 不 计 , 而 资产 净值 的 GE? 上 的 变 
化 (39. 515) 在 量 上 看 似 很 大 ,但 却 是 抽样 变异 的 结果 。 这 两 个 并 不 具有 显著 变 
化 的 测量 ,之 后 将 被 进一步 分 析 。 然 而 ,我 们 有 证 据 表 明 , 收 入 不 平等 和 财富 不 
平等 从 1991 年 到 2001 年 都 在 增加 ,而 且 , 当 我 们 集中 关注 中 部 (收入 的 p90/ 
P50、 基尼 .GEo AGE 以 及 资产 净值 的 p90/p50 和 基尼 )、 底 端 (收入 的 GE- 
和 资产 净值 的 上 半 部 对 顶部 5% 的 份额 比 ) 以 及 顶端 (收入 的 CE 和 资产 净值 
的 上 半 部 对 顶部 5% 的 份额 比 ) 时 ,这 是 正确 的 。 

在 上 面 考察 的 各 社会 群体 之 间 , 教 育 群体 的 组 间 成 分 对 这 些 中 部 和 两 端 敏 
感 的 收入 和 财富 不 平等 的 测量 具有 相对 较 大 的 贡献 ( 表 8. 3)。 我 们 现在 来 进 一 
步 考察 教育 分 组 变量 的 组 内 成 分 。 大 量 文献 证 实 , 大 学 教育 一 直 是 自 20 世纪 
80 年 代 以 来 ,日 益 增 加 的 社会 不 平等 的 一 个 重要 来 源 (Bernhardt，Morris， 
Handcock & Scott, 2001; Card & DiNardo, 2002; Coldin & Katz, 2007; 
Grogger & Eide，1995) 。 但 是 ,教育 分 布 对 收入 和 财富 分 布 的 形状 的 影响 仍 很 
难 理解 。 由 于 这 一 问题 可 以 归结 为 一 个 关于 两 个 教育 群体 之 间 收 入 或 财富 上 


的 形状 改变 的 问题 ,因此 ,我 们 利用 相对 分 布 方法 。 具 体 而 言 ,我 们 用 中 位 数 相 
对 极 化 (MRP) 及 其 成 分 (下 部 和 上 部 极 化 ) 来 研究 这 个 问题 。 我 们 的 问题 是 ,大 
学 教育 是 否 以 及 如 何 对 收入 和 财富 极 化 的 这 些 测 量 从 1991 年 到 2001 年 的 水 平 
和 变化 产生 影响 ”出 于 对 这 些 测量 进行 推断 的 考虑 ,我 们 使 用 更 为 灵活 的 自 举 
方法 ,因为 这 些 估计 量 的 渐 近 性 质 是 未 知 的 。 我 们 在 自 举 方法 中 也 考虑 了 复杂 
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调查 抽样 。 我 们 用 本 “ 詹 因 编写 的 “reldist” 来 进行 这 一 对 相对 极 化 的 分 析 。 


表 8.5 对 收入 和 资产 净值 从 1991 年 到 2001 年 出 现 变化 的 检验 





W 量 变化 PP 值 LB UB 
收入 
p10/p50 一 0. 004 0. 533 —0. 016 0. 008 
p90/ p50 0. 200 0. 000 0. 138 0. 263 
基尼 0. 039 0. 000 0. 033 0. 046 
GE_, 2.971 0. 008 0. 706 4, 437 
GE, 0. 061 0. 000 0. 050 0. 073 
GE, 0. 068 0. 000 0. 057 0. 079 
GE, 0. 139 0. 000 0. 116 0. 161 
Aos 0. 027 0. 000 0. 022 0. 031 
Ay 0. 045 0. 000 0. 036 0. 054 
Ap 0. 165 0. 003 0. 058 0. 272 
资产 净值 
p75/ p25 19. 760 0. 000 23. 367 29. 562 
p90/ p50 0. 706 0. 000 6. 419 7.011 
Le Ras die —0. 080 0. 000 —0. 106 —0. 053 
基尼 0. 069 0. 000 0. 040 0. 098 
GE, 39. 515 0. 000 一 19. 803 98. 832 


注 :LB 和 UB 代 表 95% 置 信 区 间 的 下 限 和 上 限 。 


资料 来 源 :SIPP。 


相对 分 布 分 析 分 别针 对 每 一 年 的 收入 来 进行 。 由 于 相对 分 布 方法 可 被 应 用 
于 任何 不 要 求 正 数 取 值 的 分 布 ,所 以 ,我 们 能 够 对 资产 净值 做 同样 的 分 析 。 我 们 
将 大 学 教育 作为 比较 组 ,无 大 学 教育 作为 参照 组 。 既 然 我 们 的 问题 是 关于 形状 改 
变 的 ,所 以 ，reldist 首先 以 大 学 教育 组 来 调整 无 大 学 教育 组 的 中 位 数 , 从 而 消除 
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中 位 数 差 异 的 影响 。 然 后 ,“reldist” 进 行 等 级 转换 以 得 到 调整 中 位 数 的 相对 数据 ， 
根据 这 些 数据 来 计算 MRP 及 其 成 分 一 一 底部 相对 极 化 (LRP) 和 顶部 相对 极 化 
CURP) ,可 以 得 到 MRP、LRP 和 URP 的 自 举 法 标准 误 ,以 对 SIPP 调查 设计 中 的 
聚 群 和 分 层 加 以 考虑 。 本 分 析 使 用 200 次 自 举 重复 。 为 了 构建 表 8. 6, 我 们 采用 
1991 年 和 2001 年 加 权 MRP, LRP 和 URP 以 及 自 举 法 标准 误 ,这 些 由 “reldist” 来 
得 到 。 第 一 步 , 我 们 对 每 一 年 的 MRP, LRP 和 URP 建构 一 个 95% 置 信和 区间: 
95%CI = 加 权 估 计 值 士 1.96 X BSE, 第 二 步 ,我 们 将 2001 年 的 加 权 MRP, LRP 
和 URP WA 1991 年 对 应 的 值 , 得 到 这 两 年 之 间 的 变化 。 第 三 步 , 我 们 用 
V BSEf991 + BSE3o01 来 计算 该 变化 的 标准 误 ( 假 定 这 两 年 的 极 化 测量 无 关 ) 。 

顶部 呈现 了 针对 收入 的 结果 。1991 年 ,MRP 为 0. 2583 ,这 意味 着 与 无 大 学 
教育 组 相 比 ,大 学 教育 组 中 的 25. 83% 相 对 更 加 极 化 。LRP H URP 更 大 表明 ， 
与 无 大 学 教育 组 相 比 ,大 学 教育 组 中 的 下 半 部 分 比 上 半 部 分 更 加 分 散 。 具 体 而 
言 , 大 学 教育 组 中 的 16. 22% (32. 43%/2) 已 从 中 位 数 处 进一步 朝 左边 移 动 ,而 
其 中 9, 62%(19.23%/2) 已 从 中 位 数 处 进一步 朝 右 边 移 动 。 应 当 指 出 ,我 们 现 
在 关注 的 是 形状 差异 , 且 中 位 数 差异 已 被 消除 了 。 正 如 自 举 法 标准 误 和 95% 置 
信和 区间 所 显示 的 ,所 有 3 个 极 化 测量 都 显著 地 区 别 于 0。 

这 两 个 教育 组 之 间 的 相对 收入 极 化 测量 从 1991 年 到 2001 年 都 大 大 增加 。 
具体 而 言 ,LRP 增加 了 27% (0. 0882/0. 3243 = 0.27), MPR 增加 了 23%, 而 
URP 增加 了 16%, 这 表明 ,无 大 学 教育 组 的 下 半 部 分 在 收入 分 布 上 有 一 个 更 严 
重 的 缩减 。3 个 变化 都 在 0. 01 水 平 上 统计 显著 。 

K 8. 6 的 底部 呈现 了 针对 收入 的 结果 。 毫 不 奇怪 的 是 ,根据 教育 得 到 的 财 
富 的 中 位 数 相对 极 化 要 比 收入 的 情况 更 为 严重 。 与 无 大 学 教育 组 相 比 ,大 学 教 
育 组 中 约 47. 10% 朝 分 布 的 两 个 尾部 移动 。 无 大 学 教育 组 分 布下 半 部 分 的 这 一 
集中 为 此 差异 的 主要 来 源 。 尽 管 2001 年 时 财富 的 相对 极 化 在 加 深 , 正 如 收入 相 
对 极 化 的 情况 一 样 ,但 是 ,相对 于 MRP 上 17% 的 增 量 和 LRP 上 14% 的 增 量 ,其 
上 半 部 分 的 变化 率 更 大 (25% 的 增 量 )。 因 此 ,富裕 的 大 学 教育 组 在 此 10 年 期 间 
变 得 日 益 富 裕 。 这 些 变化 在 0. 01 水 平 上 统计 显著 。 
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表 8.6 ”对 以 大 学 教育 划分 的 加 权 相 对 极 化 自 1991 年 到 2001 年 变化 的 检验 





测 量 估计 值 BSE LB UB 
收入 (1991 年 ) 
MRP 0. 2583 . 0084 0. 2419 0. 2748 
LRP 0. 3243 .0134 0. 2980 0. 3506 
URP 0. 1923 . 0101 0. 1726 0. 2121 
收入 (2001 年 ) 
MRP 0. 3175 . 0070 0. 3038 0. 3311 
LRP 0. 4125 . 0190 0. 3912 0. 4338 
URP 0. 2224 . 0084 0. 2059 0. 2390 
变化 
MRP 0. 0592” . 0109 
LRP 0. 0882" 0172 
URP 0. 0301** 0131 
资产 净值 (1991 年 ) 
MRP 0. 4710 .0111 0. 4494 0. 4927 
LRP 0. 6592 . 0205 0. 6190 0. 6994 
URP 0. 2829 . 0094 0. 2644 0. 3013 
资产 净值 (2001 年 ) 
MRP 0. 5529 . 0056 0. 5419 0. 5640 
LRP 0.7516 . 0098 0. 7324 0. 7708 
URP 0. 3543 . 0070 0. 3406 0. 3679 
变化 
MRP 0. 0819 . 0124 
LRP 0. 0924 . 0227 
URP 0. 0714 .0117 


注 :BSE: 自 举 法 标准 误 ;LRP: 下 部 相对 极 化 ;MRP: 中 位 数 相 对 极 化 ; URP: 上 部 相对 极 化 。 


代表 95% 置 信 区 间 的 下 限 和 上 限 。 


= 表示 p 二 0.01。 
资料 来 源 :SIPP。 


分 解 收入 和 财富 不 平等 的 变动 趋势 


LB 和 UB 


上 一 节 的 结果 证 实 , 收 入 和 财富 的 许多 不 平等 测量 在 此 10 年 期 间 显著 不 
同 。 收 入 不 平等 由 分 类 机 制 ( 社 会 结构 或 者 运气 ) 和 人 口 特征 的 构成 决定 。 在 


577 


578 


| 社会 科学 中 的 数理 基础 及 应 用 


分 类 机 制 不 变 的 情况 下 ,种 族 或 民族 ,年 龄 .教育 ,家 庭 户 类 型 和 其 他 特征 的 变 
化 会 改变 收入 和 财富 的 不 平等 。 同 样 ,在 这 些 特征 构成 不 变 的 情况 下 ,分 类 机 
制 上 的 变化 也 会 改变 不 平等 的 图 景 。 因 此 ,下 一 个 必然 的 问题 就 是 ,如 何 量化 
这 两 个 成 分 的 相对 贡献 ? 

使 用 一 个 预测 变量 来 考察 某 一 时 间 的 不 平等 是 有 问题 的 ,因为 存在 一 个 以 

上 的 总 体 协 变量 ,同时 ,这 些 协 变量 是 相互 相关 的 。 比 如 ,黑人 更 可 能 是 低 教育 

的 .生活 在 单身 母亲 家 庭 户 中 或 者 西部 。 因 此 ,需要 一 个 多 元 回归 分 析 框 架 。 
当 我 们 要 对 整个 分 布 进行 考察 和 趋势 分 解 时 ,分 位 数 回归 比 线性 回归 更 具 优 
势 。 我 们 将 马 沙 杜 和 玛 塔 的 方法 应 用 于 收入 和 资产 净值 的 不 平等 趋势 分 解 。 
我 们 的 QRM 设 定 纳入 了 16 个 协 变量 :代表 种 族 或 民族 的 3 个 虚拟 变量 、 年 龄 
和 年 龄 的 平方 . 受 教育 年 数 .代表 6 类 家 庭 户 的 5 个 虚拟 变量 家庭 户 规模 .代表 
区 域 的 3 个 虚拟 变量 以 及 城市 地 区 。 

以 收入 为 例 , 我 们 执行 了 以 下 程序 : 

程序 A: 分 别 对 1991 年 和 2001 年 模拟 基于 分 位 数 回归 的 收入 边缘 分 布 。 

(1) 从 均匀 分 布 U(0, 1) 中 随机 地 选取 一 个 U。 

(2) 用 1991 年 的 数据 估计 第 器 个 分 位 数 回 归 模 型 .118] 

(3) 从 1991 年 的 数据 中 选取 一 个 规模 为 40 的 自 举 法 样本 ,并 得 到 基于 分 
位 数 回 归 模 型 估计 值 的 预测 收入 。 

(4) 将 步骤 (1) 到 步骤 (3) 重 复 500 次 。 

(5) 将 预测 的 收入 值 放 在 一 起 ,得 到 一 个 基于 分 位 数 回归 模型 (针对 500 
个 不 同 分 位 数 ) 的 1991 年 收入 边缘 分 布 的 随机 样本 ,样本 规模 为 500 X 40 = 
20000, 

(6) 重复 步骤 (1) 到 步骤 (5), 用 2001 年 的 数据 减 去 1991 年 的 数据 。 

程序 B: 用 2001 年 的 分 位 数 回归 模型 系数 和 1991 年 的 协 变量 数据 模拟 反 
事实 收入 边缘 分 布 ( 反 事实 顺序 1) 。 用 1991 年 的 分 位 数 回归 模型 系数 和 2001 
年 的 协 变量 数据 模拟 相反 顺序 的 反 事实 收入 边缘 分 布 ( 反 事实 顺序 2) 

根据 1991 年 的 边缘 分 布 和 2001 年 的 边缘 分 布 ,我 们 得 到 某 一 不 平等 测量 
的 整体 变化 ( 表 8. 7 第 三 行 )。 对 于 每 一 个 反 事实 顺序 ,我 们 用 第 7 章 中 介绍 过 
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的 方法 (见方 程 7. 2) 来 得 到 一 个 不 平等 测量 的 构成 成 分 和 条 件 成 分 。 对 每 一 个 
反 事 实 顺序 的 记录 求 平 均值 ,我 们 得 到 构成 成 分 和 条 件 成 分 的 最 终结 果 ( 表 8. 7 
的 最 后 两 行 ) 。 

ER 8. 7 中 ,基于 边缘 分 布 (根据 分 位 数 回归 模型 得 到 ) 的 p90/p50 在 这 10 
年 期 间 从 2. 115 增加 到 2. 287, 这 表明 富 人 越 来 越 富裕 。 两 个 成 分 的 估计 值 在 
两 个 反 事实 排序 之 间 不 同 。 分 解 结果 显示 , 协 变 量 构 成 上 的 变化 对 第 90 个 百 分 
位 数 的 收入 相 比 于 中 位 数 收入 并 无 显著 影响 。 因 此 ,在 给 定 纳入 模型 中 协 变量 
的 情况 下 ,条 件 分 布 解释 了 较 低 p90/p50 比值 的 110. 4%。 换 言 之 ,分 类 机 制 完 
全 解释 了 以 10/50 比值 所 测量 的 日 益 增 加 的 不 平等 。 

回 到 基尼 、 泰 尔 和 GE? ,根据 它们 的 平均 值 ,我 们 看 到 ,条 件 分 布 在 给 定 协 
变量 的 情况 下 ,促使 这 10 年 间 的 收入 不 平等 增加 。GE-1 估 计 值 的 变异 较 高 ， 
因此 ,这 些 结果 在 统计 上 都 不 显著 (底部 敏感 测量 的 这 一 更 大 变异 在 第 6 章 中 讨 
论 过 , 见 蒙特 卡 洛 结果 )。GEo、Ay2 和 Al 呈现 出 更 加 引 人 注 目的 模式 。 协 变 
量 构成 上 的 变化 显著 地 减少 了 这 些 指 数 所 测量 的 收入 不 平等 ,而 条 件 分 布 上 的 
变化 则 增加 了 不 平等 ,其 中 ,CEo 导致 的 增 量 为 162%, A 导致 的 增 量 为 
138. 8%% ,Al 导致 的 增 量 为 161. 5%。A2 的 估计 值 很 精确 ,因此 ,我们 没有 对 这 
些 显 著 的 结果 加 以 考察 。 总 的 来 看 , 表 8. 7 表明 , 协 变量 构成 对 日 益 增 加 的 不 平 
等 并 无 影响 ,同时 ,对 于 9 个 指数 中 的 3 个 ,它们 还 可 以 减少 不 平等 。 相 比 而 言 ， 
在 给 定 协 变量 的 情况 下 ,由 社会 结构 赋予 的 分 类 机 制 的 条 件 分 布 考察 的 9 个 指 
数 中 的 7 个 ,都 对 日 益 增 加 的 不 平等 有 影响 。 

资产 净值 的 分 位 数 回归 模型 纳入 了 与 收入 分 位 数 回 归 模 型 中 相同 的 16 个 
协 变量 。 资 产 净 值 的 分 布 是 高 度 非 正 态 的 ,因为 较 大 比例 的 家 庭 户 具 有 负 值 或 
零 值 。 分 位 数 回归 模型 具有 拟 合资 产 净值 这 种 非 正 态 分 布 数据 的 灵活 性 。 资 
产 净值 的 分 位 数 回归 模型 的 拟 合 优 度 比 针对 收入 而 得 到 的 情况 更 低 。 拟 合 优 
度 随 着 分 位 数 而 增加 ,在 0.01 到 0. 21 的 范围 内 变化 。 我 们 用 程序 A 和 程序 B 
(如 前 所 述 ) 来 分 析 以 p90/p50 比值 和 基尼 系数 所 测量 的 资产 净值 变动 趋势 。 
K 8.8 反映 出 ,此 10 年 间 的 整体 财富 不 平等 在 增加 。 两 种 反 事实 的 排序 都 强调 
给 定 协 变量 情况 下 的 条 件 分 布 比 协 变量 构成 更 重要 。 协 变量 构成 上 的 变化 
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降低 了 p90/p50 比值 ,对 基尼 系数 也 没有 显著 影响 。 相 比 而 言 ,财富 分 类 机 制 
上 的 变化 使 p90/p50 比值 增加 了 152%、 基 尼 系 数 增加 了 107. 3%。 这 些 发 现 
与 收入 不 平等 中 的 那些 发 现 相 吻 合 。 因 此 ,对 于 收入 和 财富 ,日 益 增加 的 不 平 
等 的 主要 推动 力 为 资源 在 不 同 社会 群体 间 越 来 越 不 平等 的 分 配 。 


表 8.8 基于 模型 将 财富 变动 趋势 分 解 为 构成 和 条 件 成 分 :SIPP(1991 年 和 2001 年 ) 





分 E p90/ p50 G 

1991 年 实际 的 :ECw ; C1) 5. 389 0. 678 
2001 年 实际 的 :FF Oz; C) 6. 801 0. 867 
整体 变化 1.413" 0. 189™ 
反 事实 顺序 1:F Oz: G) 

构成 成 分 —0. 586 一 0. 007 

条 件 成 分 1. 998 0. 196” 
反 事实 顺序 2: Fy,; C) 

构成 成 分 一 0.884* —0. 021* 

条 件 成 分 2. 296" 0. 210" 
反 事 实 顺序 1 和 2 的 平均 

构成 成 分 —0. 735" —0.014 

条 件 成 分 2. 147” 0. 203” 
百分比 贡献 

构成 成 分 —§2. OF 一 7.3 

条 件 成 分 152.0" 107.3" 


注 :分 位 数 回归 模型 纳入 了 16 个 协 变量 (具体 见 正文 ) 。 
* 表示 P<0. 05, ” 表示 p<0.01, 
资料 来 源 :SIPP。 


小 结 


本 章 使 用 取 自 1991 年 和 2001 年 美国 家 庭 户 全 国 代表 性 样本 的 数据 ,提供 
了 一 个 对 收入 和 财富 不 平等 的 说 明 性 考察 。 收 入 和 财富 是 家 庭 户 资源 的 两 个 
支柱 ,同时 它们 又 相互 促进 。 我 们 对 收入 和 财富 不 平等 的 考察 揭示 出 ,收入 和 
财富 的 大 多 数 不 平等 测量 从 1991 年 到 2001 年 都 存在 一 个 显著 的 大 幅度 增加 。 
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分 析 进 一 步 揭示 ,在 根据 收入 和 财富 的 分 布 ,将 家 庭 户 归 类 到 不 同位 置 这 点 上 ， 
教育 群体 和 家 庭 户 类 型 是 比 种 族 或 民族 更 加 重要 的 社会 分 组 方式 。 具 体 而 言 ， 
相 比 于 无 大 学 教育 组 ,大 学 教育 组 2001 年 的 收入 和 财富 不 平等 比 1991 年 时 的 
更 加 极 化 。 相 比 而 言 ,无 大 学 教育 组 在 下 半 部 的 集中 反映 出 低 技能 者 收入 和 财 
富 的 停滞 不 前 。 最 后 ,根据 对 趋势 的 分 解 ,本 例 发 现 ,增加 收入 和 财富 不 平等 的 
主要 推动 力 为 更 不 平等 的 分 配 体系 ,而 不 是 社会 群体 构成 上 的 变化 。 

本 例 运用 了 本 书 所 介绍 的 大 多 数 方法 论 工具 来 回答 与 整体 人 口 和 按 社会 
群体 区 分 的 收入 和 财富 不 平等 有 关 的 核心 问题 。 这 些 工具 作为 一 个 整体 ,提供 
了 对 不 平等 进行 系统 考察 的 方法 。 我 们 现在 知道 ,如 何 直观 地 展示 不 平等 测 
量 , 如 何 选 取 有 限 的 不 平等 测量 来 强调 分 布 的 不 同 部 分 或 者 与 反应 变量 有 关 的 
不 平等 厌恶 水 平 ,如 何 检验 与 变化 趋势 有 关 的 假设 ,如 何 根据 各 组 群 和 来 源 分 
解 总 不 平等 ,以 及 如 何 将 趋势 分 解 成 构成 和 分 布 成 分 。 不 平等 测量 的 4 个 原则 
和 洛 伦 效 占 优 提供 了 对 跨 时 间 模 式 或 组 间 模 式 进行 比较 的 指导 原则 。 分 位 数 
函数 和 洛 伦 效 曲线 之 间 的 关系 有 助 于 将 概要 不 平等 测量 .基于 分 位 数 的 测量 和 
基于 相对 分 布 的 测量 的 位 置 改 变 与 形状 改变 区 分 开 来 。 分 位 数 回 归 模 型 可 以 
对 趋势 变化 进行 基于 模型 的 分 解 , 并 确定 什么 是 导致 收入 和 财富 不 平等 增加 的 
动力 。 

我 们 的 例子 也 说 明 ,在 对 包含 许多 负数 和 零 值 的 反应 变量 进行 处 理 时 ,我 
们 在 适用 的 工具 类 别 上 会 面临 更 多 限制 。 正 如 我 们 在 资产 净值 的 例子 中 所 展 
示 的 ,对 这 个 变量 需要 更 加 有 谨慎。 我 们 以 同时 具有 理论 和 方法 论 意义 的 说 明 性 
举例 来 结束 本 章 和 全 书 。 我 们 希望 本 书 在 获取 更 多 与 社会 不 平等 的 模式 、 来 源 
和 后 果 有 关 的 知识 并 从 事 这 些 研究 方面 对 读者 会 有 帮助 。 


| if | Y 
pd 
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附录 1 位 置 改 变 导 致 洛 伦 兹 曲线 变化 


本 附录 给 出 位 置 改变 导致 洛 伦 兹 曲线 变化 的 证 明 。 一 个 误解 就 是 ,概要 不 
平等 测量 只 描述 分 布 的 离散 度 或 形状 ,因此 , 当 我 们 对 两 个 分 布 进行 比较 时 ,只 
有 离散 度 或 形状 上 的 变化 才 要 紧 。 因 为 洛 伦 效 曲线 是 统一 诸多 不 平等 测量 的 
一 个 共同 基础 ,所 以 ,我们 认为 这 一 证 明 对 于 增进 我 们 对 不 平等 测量 的 理解 是 
必要 的 。 

只 要 存在 一 定 的 不 平等 ,最 低 为 ; 的 工资 所 得 者 的 平均 收入 就 小 于 所 有 工 
资 所 得 者 的 平均 收入 。 因 此 ， 

nD ye < >> YQ) 


这 意味 着 ， 
an Dl yo < a Pps 
最 后 ,两 边 同 时 加 上 X yo > yc ,并 进行 因 式 分 解 得 到 ， 


(an + >) yey ) 5 ya < (as + > yo) > yay 
ral i=l i=] i=l 
因此 有 : 





中 注意 ,这 里 假定 a > 0, 一 一 译 者 注 
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27 .Cat yy) ie, pio. 




















L* (s/n) = = > = L(s/n) © 
ža atx) id 
附录 2 
RAL 选取 的 概要 不 平等 测量 
名 称 公 A 
与 概率 分 布 相 联 系 的 测量 
极 差 R= Ymax ~ min 
方差 V= 十 2% 一 7) 
变异 系数 A 
y 
对 数 方差 ae) (1e(#)) =F X dogs — log 5» 
n 2 n 
对 数 的 方差 v=} (1œ(>)) = 二 > dogo) — Togo? 
i=l i=l 
基于 分 位 数 函 数 和 洛 伦 兹 曲线 的 测量 
分 位 数 比 V/V WF psp’ 
份额 测量 
底部 分 位 数 区 L(p) 
中 部 分 位 数 区 L(pu) —L(p.) 
顶部 分 位 数 区 1—L(1—p) 
基尼 系数 5 PREA 
n(n—1)y 
基于 社会 福利 函数 的 测量 
阿 特 金森 指数 1 
基于 信息 理论 的 测量 
尔 a Lt me Yi 
泰 尔 指数 T= = >; 3 | eg 7 ) | 
、 1 1 ie yi 8 
X GE, ea gale) 1] 


O ”此 方程 略 有 改动 。 一 一 译 者 注 
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附录 3 
表 A2 不 平等 测量 的 性 质 
À RÆ 人 口 规模 ”加 和 可 (0, DR 
a 转移 原则 无 关 性 无关 原则 分 解 性 值 范围 
与 概率 分 布 有 关 的 
极 差 R 不 适用 否 是 否 否 
方差 V 强 T 是 是 T 
变异 系数 c 55 是 是 是 E 
对 数 方差 v 不 适用 是 是 E 否 
对 数 的 方差 v 不 适用 是 是 否 E 
基于 分 位 数 函 数 和 洛 伦 兹 曲线 的 
分 位 数 比 不 适用 T 是 否 T 
分 位 数 区 间 份 额 不 适用 是 是 否 否 
基尼 系数 G 55 是 是 否 是 
由 社会 福利 函数 推导 的 
阿 特 金森 指数 A, 弱 是 是 E 是 
由 信息 理论 发 展 出 的 
广义 GE; 强 是 是 是 E 
附录 4 
表 A3 Stata 中 用 于 研究 不 平等 测量 的 程序 和 软件 包 

-glcurve- 凡 ， 克 尔 曼 和 人 詹金斯 (2001) 

-inequal7- 凡 “。 克 尔 曼 (2001) 

-ineqdeco-，-ineqdec0 一 詹金斯 (1999) 

-reldist- 詹 恩 (2008) 


DASP 里 的 各 种 命令 


杜 克 罗 斯 和 阿拉 尔 (2006) 
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注释 





[ 1] 一 些 人 将 峰 态 减 去 3, 从 而 使 得 取 值 都 分 布 在 0 的 周围 。 

[2 ] 如 果 Y 是 随机 变量 ,a 和 < 是 常数 ,那么 ,随机 变量 Y， = a 十 cY 被 定义 为 Y 的 线性 转换 。 
[ 3 ] 这 里 ,y; 被 假定 为 非 负 的 。 

[4 ] 为 了 明白 这 点 ,我 们 有 : 1 Ma. bye LEa iT, Es Lye. 7? = 1. 52V。 
[5] 以 50% 增 量 为 例 ,我 们 有 : 


LA iÑ = 
= 1. 5yi:— 1. 5y)? — ‘eye 
pM Beh tL ale yn ae 


1.55 F 3 














[ 6] 对 于 yw > 0, 几何 均值 被 定义 为 《了 [yw 】 ， 这 等 价 于 e+ Le 几何 均值 总 是 小 于 或 等 于 算术 
均值 。 收 入 的 几何 均值 的 对 数 就 是 对 数 收入 的 均值 。 

[ 7 ] 利用 罗 必 达 法 则 ,我 们 看 到 , lim 1 (yr 一 1)/(1 一 e) = igm- D/ 时 0 一 = log(y). 

[814 p= Ont. p 的 对 数 未 被 定义 ,但 是 ,我 们 可 以 将 p~0 时 plog(p) 的 极限 定义 为 0, 且 函 数 plog 
(P) 是 连续 的 。 

[ 9 ] 如 果 连 接 一 对 点 的 任意 线段 都 位 于 那 两 点 之 间 函 数 的 线性 内 插值 点 线段 上 方 ,那么 ,若干 变量 的 
函数 (zx1，…，z,) 被 认为 是 四 性 的 。 形 式 上 ,对 于 所 有 选取 的 (z1，…,z,) 、(y1，…， on) BER 
值 范围 在 0 到 1 之 间 的 ,我 们 都 有 ， 


GOGE ssn Bn) F CL—A) Gyre y >)】 ZS Af (ais s Fay FOL —ADF Os sy Yad 
[10] 方程 3. 8a 和 方程 3. 8b 之 间 的 中 间 步 又 如 下 : 
T =— > Flog (— )+ Ùs ilog(si) 一 一 log (二 )+ X) slows ) 


=—log (+ ) Ss, +d) silog(s = 5 i[ logs» — 10g (+) | 


[11] SAA SEL OKADA AEE KA BU(Lerman & Yitzhaki，1984) 。 分 解 方程 为 乘积 形式 。 根 
据 分 解 , 他 们 得 到 基尼 系数 的 一 个 要 素 的 边际 效应 1%% 的 增 量 。 洛 佩 效 - 费 德 曼 在 Stata 程序 “de- 
scogini” 中 实现 了 勒 曼 和 伊 达 沙 基 方 法 (Lopez-Feldman，2006)。 使 用 这 一 程序 ,我 们 发 现 ,1991 
年 时 资产 公平 1% 的 增 量 将 使 得 基尼 系数 减少 5. 7%，2001 年 时 ,这 一 效应 将 更 强 (7. 4%)。 

[12] 对 于 xm 个 分 布 ,成 对 比较 的 数量 就 是 mCm 一 1)/2。 当 我 们 对 两 年 中 的 收入 分 布 进 行 比较 时 ,尽管 

成 对 比较 的 数量 只 为 1, 但 当 我 们 对 10 年 的 收入 分 布 进行 比较 时 ,这 个 数值 增加 到 45。 

[13] 一 般 性 的 保 测 变换 可 被 视 为 是 通过 将 单位 区 间 [0, ]] 分 割 成 任意 段 然 后 将 这 些 段 打 乱 所 界定 的 

一 种 变换 。 

[14] 这 一 蒙特 卡 洛 实验 的 全 部 结果 可 在 本 书 的 网 站 上 找到 。 

[15] 对 于 约 等 于 1 的 分 析 性 权重 ,Stata 以 加 总 数据 中 的 观测 数 内 在 地 将 它们 重新 尺度 化 ,所 得 的 群 

体 比 例 被 改变 成 与 其 他 年 份 的 相似 。 

[16] 我 们 设 定 了 一 个 不 含 交互 项 的 加 和 模型 。 此 模型 过 于 简单 ,因为 它 假定 ,没有 协 变量 会 通过 任何 
其 他 协 变量 影响 y。 
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[17] 仅仅 出 于 示例 说 明 的 考虑 ,我 们 在 这 里 使 用 了 一 个 简单 设 定 。 更 为 真实 的 例子 可 在 第 8 章 中 


找到 。 

[18] 在 《分 位 数 回 归 ) 一 书 中 (Hao & Naiman, 2007) ,我 们 讨论 了 拟 合 的 第 p 个 分 位 数 回 归 模 型 的 拟 
合 优 度 测量 , 记 为 R(p)。 这 里 ,我 们 注意 到 ,对 于 拟 合 的 分 位 数 回归 模型 ,p10 处 的 R 为 0. 1543, 
p90 处 的 尺 为 0.2573。 这 表明 ,相对 于 低 端 尾 部 ,模型 解释 了 顶端 尾部 的 更 多 变异 。 所 有 估计 系 


数 都 具有 预期 的 方向 且 大 多 数 协 变 都 是 统计 显著 的 。 
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additive decomposition 


asymptotic approach — 


Asymptotic Standard Errors(ASE) : 
Atkinson family of inequality indices . 


bandwidth, of an estimator 
bootstrap approach 

Bootstrap Standard Error(BSE) 
CDF (Cumulative Distribution | l 
central moments 
coefficient of variation 
counterfactual decomposition m c 
DASP (Distributive Analysis Stat 
entropy 
Gaussian distribution 
generalized entropy : 
generalized Lorenz curves 
geometric mean ， 

Gini coefficient 

Gini index 

grade transformation 
inequality aversion parameter | 
information entropy 
interactive decomposition 
Kullbacke Leibler divergence 
kurtosis . 
location shift 

logarithmic variance _ 
logarithm of variance - 


Lorenz consistency 、 


Lorenz curves 

Lorenz doriae 

Lorenz intersection 
LRP(Lower-portion Relativ 
measure-preserving function 


median - 
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